pandas dataframe增加一列

pandas dataframe增加一列

pandas dataframe增加一列

在数据处理中,经常需要在Pandas的DataFrame中增加一列来存储新的数据或进行计算。本文将讨论如何在Pandas DataFrame中添加新列,包括添加静态数值、基于已有列计算的结果以及根据特定条件添加列。

添加静态数值列

首先,我们可以直接为DataFrame分配一个标量值来添加新列。下面是一个简单的示例:

import pandas as pd

# 创建一个示例DataFrame
data = {'A': [1, 2, 3, 4, 5],
        'B': ['a', 'b', 'c', 'd', 'e']}
df = pd.DataFrame(data)

# 添加一个名为'C'的新列,全部赋值为10
df['C'] = 10

print(df)

运行以上代码,输出如下:

   A  B   C
0  1  a  10
1  2  b  10
2  3  c  10
3  4  d  10
4  5  e  10

可以看到,新的列’C’被成功添加到了DataFrame中,并且所有行的值都被赋为10。

基于已有列计算新列

在许多情况下,我们需要根据已有列的数值进行计算,然后添加一个新列存储计算结果。下面是一个示例:

# 基于已有列'A'的数值计算新列'D'的值
df['D'] = df['A'] * 2

print(df)

运行以上代码,输出如下:

   A  B   C  D
0  1  a  10  2
1  2  b  10  4
2  3  c  10  6
3  4  d  10  8
4  5  e  10  10

可以看到,根据已有列’A’的值进行计算后,新列’D’成功添加到了DataFrame中。

根据条件添加新列

有时候我们需要根据某些条件来判断是否添加新列。下面是一个示例:

# 根据'A'列的值是否大于3来添加新列'E'
df['E'] = df['A'].apply(lambda x: 'Yes' if x > 3 else 'No')

print(df)

运行以上代码,输出如下:

   A  B   C  D    E
0  1  a  10  2   No
1  2  b  10  4   No
2  3  c  10  6   No
3  4  d  10  8  Yes
4  5  e  10  10  Yes

可以看到,根据条件判断后,成功添加了新列’E’,并根据条件给出了相应的值。

结语

本文介绍了在Pandas DataFrame中添加新列的几种方法,包括添加静态数值列、基于已有列计算新列以及根据条件添加新列。通过灵活运用这些方法,我们可以更轻松地处理和分析数据。

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程