pandas dataframe循环编辑|极客笔记

pandas dataframe循环编辑

在数据处理过程中，经常需要对pandas dataframe进行循环操作，对每行数据进行特定处理或计算。本文将详细介绍如何使用pandas库对dataframe进行循环编辑的方法。

准备工作

首先我们需要导入pandas库，如果没有安装pandas，可以使用以下命令进行安装：

!pip install pandas

导入pandas库：

import pandas as pd

创建一个示例dataframe

为了方便演示，我们首先创建一个示例的dataframe：

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Score': [80, 85, 90, 95]}

df = pd.DataFrame(data)

print(df)

运行以上代码，可以看到输出的dataframe如下：

      Name  Age  Score
0    Alice   25     80
1      Bob   30     85
2  Charlie   35     90
3    David   40     95

使用iterrows()方法进行循环编辑

pandas提供了iterrows()方法，可以遍历dataframe的每一行数据。我们可以在循环中对每行数据进行编辑操作。

for index, row in df.iterrows():
    df.at[index, 'Age'] = row['Age'] + 1
    df.at[index, 'Score'] = row['Score'] * 1.1

print(df)

运行以上代码，可以看到输出的dataframe如下：

      Name  Age  Score
0    Alice   26   88.0
1      Bob   31   93.5
2  Charlie   36   99.0
3    David   41  104.5

在以上代码中，我们通过iterrows()方法遍历dataframe的每一行数据，然后对Age列加1，对Score列乘以1.1进行编辑操作。

使用apply()方法进行循环编辑

除了iterrows()方法，pandas还提供了apply()方法，可以对整列数据进行操作。我们可以使用apply()方法结合lambda表达式对某一列进行编辑操作。

df['Score'] = df['Score'].apply(lambda x: x * 1.1)

print(df)

运行以上代码，可以看到输出的dataframe如下：

      Name  Age  Score
0    Alice   26   96.8
1      Bob   31  103.3
2  Charlie   36  110.0
3    David   41  115.5

在以上代码中，我们使用apply()方法结合lambda表达式对Score列乘以1.1进行编辑操作。

总结

通过以上介绍，我们学习了如何使用pandas对dataframe进行循环编辑操作。在实际数据处理中，对dataframe进行循环编辑是非常常见的操作，可以根据具体需求选择合适的方法进行编辑。

pandas dataframe循环编辑