Python 如何创建DataFrame
Dataframe是一个二维数据结构。Dataframe用于以行和列的形式表示数据的表格格式。它类似于电子表格或SQL表。Dataframe是Pandas对象。
要创建一个Dataframe,我们需要导入pandas库。Dataframe可以使用dataframe()函数来创建,该函数接受一个或两个参数。第一个参数是要填充到Dataframe表中的数据。数据可以是列表的列表或字典的列表形式。对于列表的列表数据,第二个参数是列名。
通过字典的列表创建Dataframe
import pandas as pd
data={'Name':['Karan','Rohit','Sahil','Aryan'],'Age':[23,22,21,24]}
df=pd.dataframe(data)
df #print the dataframe
输出将是一个表格,有两列名为 ‘Name’ 和 ‘Age’,并且将提供的数据填入表格。
从列表中创建Dataframe
import pandas as pd
data=[['Karan',23],['Rohit',22],['Sahil',21],['Aryan',24]]
df=pd.dataframe(data,columns=['Name','Age'])
df
这也会得到相同的输出。唯一的区别是数据提供的形式。由于在之前没有指定列名,需要在dataframe()函数中将列名作为参数传递。
创建自定义索引的Dataframe
import pandas as pd
data={'Name':['Karan','Rohit','Sahil','Aryan'],'Age':[23,22,21,24]}
df=pd.dataframe(data,index=['No.1','No.2','No.3','No.4'])
df
这将创建一个与索引列表中提到的索引相同的数据帧。