Pandas：手动排序列的数据透视表

在本文中，我们将介绍如何使用 Pandas 创建数据透视表，并手动排序列的顺序。数据透视表是一种用于数据分析的强大工具，它可以对数据进行汇总、筛选和操作，并将处理后的数据按照预定方式进行展示。

Pandas 数据透视表

Pandas 提供了方便的函数 pivot_table()，用于创建数据透视表。假设我们有以下示例数据：

Name	Age	Gender	City	Sales
Amy	25	Female	NY	200
Bob	30	Male	LA	150
Amy	25	Female	NY	300
Amy	25	Female	LA	100
Bob	30	Male	NY	250
Cat	35	Female	LA	180

我们可以使用 pivot_table() 将数据按照城市和性别进行汇总，计算销售额的平均值：

import pandas as pd

data = pd.read_csv('sales.csv')
table = pd.pivot_table(data, values='Sales', index=['City', 'Gender'], aggfunc='mean')
print(table)

输出结果如下：

              Sales
City Gender        
LA   Female  180.00
     Male    150.00
NY   Female  250.00
     Male    200.00

其中，values 参数指定需要汇总的数值列，index 参数指定用于分类的列。aggfunc 参数指定汇总方式，此处使用了平均值。

手动排序列

假设我们需要按照特定的顺序展示数据透视表中的列，但默认情况下 Pandas 会自动按照字典序对列进行排序。此时，我们可以使用 reindex() 函数重新排序列。例如，我们可以按照女性销售额和男性销售额的顺序进行排序：

table = table.reindex(columns=['Sales', 'Gender'], level=1)
print(table)

输出结果如下：

              Sales  Gender
City Gender               
LA   Female  180.00  Female
     Male    150.00    Male
NY   Female  250.00  Female
     Male    200.00    Male

其中，columns 参数指定列的顺序，level 参数指定需要排序的层级。