pandas dataframe 遍历行|极客笔记

pandas dataframe 遍历行

在处理数据分析和数据处理时，我们经常会使用pandas库来操作数据。pandas提供了DataFrame这个数据结构，它类似于Excel表格，可以方便地对数据进行筛选、计算和可视化等操作。在处理DataFrame时，有时需要遍历每一行数据，进行特定的处理或计算。本文将详细介绍如何在pandas中遍历DataFrame的行数据。

创建一个示例DataFrame

为了方便演示，我们先创建一个示例DataFrame。下面的代码会生成一个包含学生姓名、年龄和成绩的DataFrame：

import pandas as pd

data = {'姓名': ['小明', '小红', '小刚', '小美'],
        '年龄': [20, 21, 22, 23],
        '成绩': [80, 85, 90, 95]}

df = pd.DataFrame(data)
print(df)

运行上述代码，我们可以得到如下的DataFrame：

   姓名  年龄  成绩
0  小明  20  80
1  小红  21  85
2  小刚  22  90
3  小美  23  95

遍历DataFrame的行数据

方法一：使用iterrows()

pandas提供了iterrows()方法来遍历DataFrame的行数据。下面的代码展示了如何使用iterrows()方法遍历DataFrame的每一行：

for index, row in df.iterrows():
    print(index, row['姓名'], row['年龄'], row['成绩'])

运行上述代码，可以看到输出为：

方法二：使用iterrows()和to_dict()

另一种遍历DataFrame行数据的方法是先将每一行转换为字典，然后再遍历字典的键值对。下面的代码展示了这种方法：

for index, row in df.iterrows():
    row_dict = row.to_dict()
    print(index, row_dict['姓名'], row_dict['年龄'], row_dict['成绩'])

运行上述代码，也可以得到相同的输出：

方法三：使用itertuples()

除了iterrows()，pandas还提供了itertuples()方法来遍历DataFrame的行数据。itertuples()方法返回的是一个命名元组，可以直接通过属性名来访问每一列的数值。下面的代码演示了如何使用itertuples()方法：

for row in df.itertuples():
    print(row.Index, row.姓名, row.年龄, row.成绩)

运行上述代码，同样可以得到相同的输出：

总结

本文介绍了在pandas中遍历DataFrame的行数据的方法，包括使用iterrows()、itertuples()和to_dict()。这些方法可以帮助我们方便地对DataFrame的每一行数据进行操作，从而更灵活地处理数据。在实际应用中，根据不同的需求和数据结构，选择合适的方法来遍历DataFrame是很重要的。