pandas怎么将多列合成一列|极客笔记

pandas怎么将多列合成一列

在数据处理中，我们经常会遇到需要将多列数据合并成一列的情况。比如在一些原始数据表中，数据可能被分散存储在不同的列中，为了方便后续分析和处理，我们希望将这些数据合并到一个新列中。在Python的数据处理库pandas中，提供了多种方法来实现将多列合并成一列的操作。本文将详细介绍这些方法，并给出示例代码。

方法一：使用`pd.melt()`

pd.melt()方法可以将指定的多列合并成一列，并且保留其他列的数据。下面是一个示例：

import pandas as pd

# 创建一个示例DataFrame
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6],
    'C': [7, 8, 9]
}
df = pd.DataFrame(data)

# 使用pd.melt()方法将列'A'、'B'、'C'合并成一列，并保留其他列的数据
df = pd.melt(df, value_vars=['A', 'B', 'C'], var_name='original_column', value_name='new_column')

print(df)

运行上述代码，得到的合并后的DataFrame如下：

  original_column  new_column
0               A           1
1               A           2
2               A           3
3               B           4
4               B           5
5               B           6
6               C           7
7               C           8
8               C           9

上面的示例中，原始的DataFrame中有列’A’、’B’、’C’，使用pd.melt()方法将这些列合并成了一列’new_column’，同时通过var_name参数指定了合并前的列的名称。

方法二：使用`pd.concat()`方法

pd.concat()方法可以将多列数据合并为一列，但是该方法需要对原始数据进行适当的处理，将列数据转为一维数组。下面是一个示例：

import pandas as pd

# 创建一个示例DataFrame
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6],
    'C': [7, 8, 9]
}
df = pd.DataFrame(data)

# 使用pd.concat()方法将列'A'、'B'、'C'合并成一列
df['new_column'] = pd.concat([df['A'], df['B'], df['C']], ignore_index=True)

# 删除原始的'A'、'B'、'C'列
df = df.drop(columns=['A', 'B', 'C'])

print(df)

运行上述代码后，得到的合并后的DataFrame如下：

   new_column
0           1
1           2
2           3
3           4
4           5
5           6
6           7
7           8
8           9

上面的示例中，首先通过pd.concat()方法将列’A’、’B’、’C’的数据合并成一维数组，然后将这个合并后的数组赋给新的列’new_column’，最后再删除原始的列。

方法三：使用`pd.stack()`方法

pd.stack()方法可以将DataFrame的多列数据堆叠到一列中。下面是一个示例：

import pandas as pd

# 创建一个示例DataFrame
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6],
    'C': [7, 8, 9]
}
df = pd.DataFrame(data)

# 使用pd.stack()方法将列'A'、'B'、'C'合并成一列
df = df.stack().reset_index(name='new_column').drop(columns='level_1')

print(df)

运行上述代码后，得到的合并后的DataFrame如下：

   level_0  new_column
0        0           1
1        0           4
2        0           7
3        1           2
4        1           5
5        1           8
6        2           3
7        2           6
8        2           9

上面的示例中，利用pd.stack()方法将列’A’、’B’、’C’的数据堆叠到一列中，并通过reset_index()方法将索引重置为列，然后再删除多余的列。

综上所述，本文介绍了pandas中将多列合并成一列的几种常用方法，通过这些方法可以轻松处理数据中的多列数据，为后续的数据分析和处理提供便利。在实际工作中，可以根据具体的情况选择合适的方法来完成数据的合并操作。