Python Pandas – 使用原始索引和名称创建DataFrame
Pandas是Python中一个强大的数据处理库,可以轻松地对结构化数据进行处理、转换和可视化。其中DataFrame是Pandas的核心数据结构,类似于关系型数据库中的表格。在创建DataFrame时,有多种方法来指定行和列的名称。本文将介绍如何使用原始索引和名称来创建DataFrame对象。
创建DataFrame的基本方法
在Pandas中,最基本的创建DataFrame的方法是通过字典构建。例如,下面的代码可以创建一个DataFrame对象,其中有’temperature’和’humidity’两列,索引为0,1,2。
import pandas as pd
d = {'temperature': [20, 25, 30], 'humidity': [50, 60, 70]}
df = pd.DataFrame(data=d)
print(df)
输出为:
temperature humidity
0 20 50
1 25 60
2 30 70
使用原始索引创建DataFrame
在使用原始索引创建DataFrame之前,我们先来看一下什么是原始索引。在Pandas中,数据框的每一行都有一个唯一的索引值。默认情况下,Pandas会使用从0开始的整数作为索引。但是,我们也可以使用其它类型的值作为索引,例如字符串、日期或者数字。
了解原始索引后,我们可以使用Pandas中的pd.DataFrame函数来创建一个DataFrame对象,同时指定行和列的标签。
import pandas as pd
data = {"temperature": [20, 25, 30],
"humidity": [50, 60, 70]}
index = ["2021-01-01", "2021-01-02", "2021-01-03"]
df = pd.DataFrame(data, index=index)
print(df)
输出为:
temperature humidity
2021-01-01 20 50
2021-01-02 25 60
2021-01-03 30 70
使用原始名称创建DataFrame
在某些情况下,我们可能希望使用列的名称来创建DataFrame,而不是将它们作为字典键。为此,可以创建一个空的DataFrame,并用列的名称填充它。
import pandas as pd
df = pd.DataFrame(columns=["temperature", "humidity"])
df["temperature"] = [20, 25, 30]
df["humidity"] = [50, 60, 70]
print(df)
输出为:
temperature humidity
0 20 50
1 25 60
2 30 70
验证DataFrame的原始索引和名称
通过以下方法可以查看.DataFrame对象中的索引和名称信息:
import pandas as pd
data = {"temperature": [20, 25, 30],
"humidity": [50, 60, 70]}
index = ["2021-01-01", "2021-01-02", "2021-01-03"]
df = pd.DataFrame(data, index=index)
print(df.index)
print(df.columns)
输出为:
Index(['2021-01-01', '2021-01-02', '2021-01-03'], dtype='object')
Index(['temperature', 'humidity'], dtype='object')
结论
本文介绍了如何使用原始索引和名称来创建DataFrame对象。使用原始索引可以为DataFrame添加自己的索引标签,提高数据可读性;使用原始名称可以更好地掌握表格的结构。
极客笔记