Python Pandas – 从DataFrame显示特定数量的行

Python Pandas – 从DataFrame显示特定数量的行

Pandas 是 Python 中一个强大的数据处理库,它对于数据处理和分析非常有用。在 Pandas 中,DataFrame 是一个被广泛使用的数据结构,它类似于 Excel 的电子表格和 SQL 数据库中的表格,可以包含多个行和列的数据,可以进行各种操作,如过滤、排序、分组、聚合等。在这篇文章中,我们将介绍如何在 DataFrame 中显示特定数量的行。

背景

当我们在 Pandas 中使用 DataFrame 处理大规模数据集时,我们经常需要查看数据的一部分,而不是所有数据。有时候我们需要只显示前几行或后几行的数据,或者显示数据集中的随机行,以便快速了解数据的结构和内容。Pandas 提供了一些工具来满足这些需求。

head() 和 tail() 方法

head() 和 tail() 方法是 Pandas 中最常用的方法之一,它们可以帮助我们快速预览 DataFrame 中的一部分数据。head() 方法显示 DataFrame 中的前几行,默认显示前 5 行。tail() 方法显示 DataFrame 中的后几行,默认显示后 5 行。下面是 head() 和 tail() 方法的示例代码:

import pandas as pd

# 创建一个包含100行和4列数据的DataFrame
data = pd.DataFrame({
    'Name': ['Alice', 'Bob', 'Charlie', 'David'] * 25,
    'Age': [25, 30, 35, 40] * 25,
    'Gender': ['F', 'M'] * 50,
    'Salary': [50000, 60000, 70000, 80000] * 25
})

# 显示前5行数据
print(data.head())

# 显示后5行数据
print(data.tail())

输出:

      Name  Age Gender  Salary
0    Alice   25      F   50000
1      Bob   30      M   60000
2  Charlie   35      F   70000
3    David   40      M   80000
4    Alice   25      F   50000
      Name  Age Gender  Salary
95   David   40      M   80000
96   Alice   25      F   50000
97     Bob   30      M   60000
98  Charlie   35      F   70000
99    David   40      M   80000

从输出结果可以看出,head() 方法显示 DataFrame 中的前 5 行,tail() 方法显示 DataFrame 中的后 5 行。我们还可以将参数传递给这两个方法来指定要显示的行数,例如:

# 显示前10行数据
print(data.head(10))

# 显示后10行数据
print(data.tail(10))

iloc[] 方法

iloc[] 方法是 Pandas 中另一个非常有用的方法,它可以用于按位置索引访问 DataFrame 中的数据。例如,我们可以使用 iloc[0:5] 访问 DataFrame 的前 5 行,使用 iloc[-5:] 访问 DataFrame 的后 5 行。下面是 iloc[] 方法的示例代码:

# 显示前5行数据
print(data.iloc[0:5])

# 显示后5行数据
print(data.iloc[-5:])

输出:

      Name  Age Gender  Salary
0    Alice   25      F   50000
1      Bob   30      M   60000
2  Charlie   35      F   70000
3    David   40      M   80000
4    Alice   25      F   50000
      Name  Age Gender  Salary
95   David   40      M   80000
96   Alice   25      F   50000
97     Bob   30      M   60000
98  Charlie   35      F   70000
99    David   40      M   80000
我们还可以使用 iloc[] 方法来选择特定的行和列。例如,我们可以使用 iloc[0:5, 0:2] 来选择前 5 行和前 2 列,即姓名和年龄。下面是 iloc[] 方法选择特定行和列的示例代码:

```python
# 显示前5行和前2列数据
print(data.iloc[0:5, 0:2])

输出:

      Name  Age
0    Alice   25
1      Bob   30
2  Charlie   35
3    David   40
4    Alice   25

我们还可以使用 iloc[] 方法和 numpy.random.choice() 函数来选择 DataFrame 中的随机行。例如,我们可以使用 iloc[numpy.random.choice(df.index, size=10)] 来选择 DataFrame 中的随机 10 行。下面是选择随机行的示例代码:

import numpy as np

# 选择随机10行数据
print(data.iloc[np.random.choice(data.index, size=10)])

sample() 方法

除了 iloc[] 方法外,Pandas 还提供了 sample() 方法来选择 DataFrame 中的随机行。与 iloc[] 方法不同的是,sample() 方法允许我们指定要显示的行数,而不是使用索引范围或 numpy.random.choice() 函数。例如,我们可以使用 data.sample(n=10) 来选择 DataFrame 中的随机 10 行。下面是 sample() 方法选择随机行的示例代码:

# 显示随机10行数据
print(data.sample(n=10))

结论

在 Pandas 中,我们可以使用 head() 和 tail() 方法来显示 DataFrame 中的前几行或后几行,使用 iloc[] 方法来按位置索引访问 DataFrame 中的数据和选择特定的行和列,使用 sample() 方法来选择 DataFrame 中的随机行。无论是在数据探索过程中还是在数据分析和建模过程中,这些方法都非常实用,并且可以帮助我们快速了解数据的结构和内容。

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程