Python Pandas ŌĆō 查找一列的最大值并返回相应的行值

在数据分析和处理中，经常需要查找数据中某列的最大或最小值，并返回相应的行值。在 Python 中，可以使用 Pandas 库来完成这个任务。Pandas 是 Python 中用于数据分析和处理的一个常用库，它支持快速的数据清洗、准备和分析等操作。

Pandas 库

Pandas 库主要有两个数据结构，即 Series 和 DataFrame。其中，Series 是一种类似于一维数组的数据结构，每个元素拥有自己的索引，而 DataFrame 是一个二维表格，由多个行和列组成。在 Pandas 中，我们可以通过读取外部数据源或手动创建 Series 和 DataFrame，进行数据的加载和处理。

下面是一个自定义的 DataFrame 示例：

import pandas as pd

data = {
    'name': ['Tom', 'Jerry', 'Jack', 'Rose', 'Lisa'],
    'age': [20, 25, 24, 22, 26],
    'score': [75, 80, 85, 90, 95]
}

df = pd.DataFrame(data)
print(df)

运行结果如下：

    name  age  score
0    Tom   20     75
1  Jerry   25     80
2   Jack   24     85
3   Rose   22     90
4   Lisa   26     95

查找最大值并返回相应的行值

上述 DataFrame 示范了一个由 name、age 和 score 三个列组成的表格，我们可以通过 Pandas 提供的 max() 函数查找 score 列的最大值，并返回相应的行值：

score_max = df['score'].max()
df_score_max = df[df['score'] == score_max]
print(df_score_max)

运行结果如下：

   name  age  score
4  Lisa   26     95

首先通过 df['score'] 选取 score 列，再使用 .max() 查找该列的最大值，将结果赋值给变量 score_max。接着使用 df[df['score'] == score_max] 将 DataFrame 数据根据 score_max 对应的值进行筛选并赋值给变量 df_score_max，最后打印结果即可得到 score 列最大值所在的行数据。

数据透视表

除了上述方法外，Pandas 还提供了数据透视表（Pivot Table）的操作，用于快速对数据进行分析和汇总。数据透视表可按照指定的行、列和值进行汇总，并按照设定的方法进行计算。下面的代码示例演示了如何使用 Pandas 创建数据透视表：

import pandas as pd

data = {
    'name': ['Tom', 'Jerry', 'Jack', 'Rose', 'Lisa'],
    'gender': ['male', 'male', 'male', 'female', 'female'],
    'age': [20, 25, 24, 22, 26],
    'score': [75, 80, 85, 90, 95]
}

df = pd.DataFrame(data)
df_pivot = df.pivot_table(index='gender', values='score', aggfunc='max')
print(df_pivot)

运行结果如下：

        score
gender       
female     95
male       85

该示例数据新增了 gender 列，用于演示在数据透视表中如何按照指定的行进行汇总。数据透视表的创建使用 .pivot_table() 函数，需要指定 index、values 和 aggfunc 参数，其中，index 表示按照哪一列进行行索引，values 表示按照哪一列进行计算，aggfunc 表示计算统计方法，这里使用的是max，表示最大值。最后打印出数据透视表即可得到 gender 列的最大值汇总。