Python Pandas ：如何使用 Pandas DataFrame 属性：shape

在 Pandas 库中，DataFrame 是一种常见的数据结构，它是一个二维数组，即由行和列组成的表格。使用 Pandas 的 DataFrame 可以方便地处理数据，通过 DataFrame 中的相关属性和方法，我们可以轻松地对数据进行分析和操作。

在本篇文章中，我们将介绍 Pandas 的一个重要属性：shape。通过 shape 属性，我们可以查看 DataFrame 的形状，即行数和列数。在数据分析和操作中，了解 DataFrame 的形状对于理解数据的特征、分析数据的关系以及处理数据的方法至关重要。

Pandas中shape属性的使用

在 Pandas 中，我们可以使用 DataFrame 对象的 shape 属性来查看 DataFrame 的形状。shape 是一个元组类型，由两个整数组成，第一个整数表示 DataFrame 的行数，第二个整数表示 DataFrame 的列数。

例如，我们从CSV文件中加载数据，如下所示：

import pandas as pd

df = pd.read_csv('example.csv')

假设已经成功加载数据，这时候我们可以使用 shape 属性来查看 DataFrame 的形状，代码如下：

print(df.shape)

运行结果可能类似于以下内容：

(100, 5)

上述结果表明，当前 DataFrame 包含 100 行数据和 5 列数据。

Pandas中shape属性常见用途

检查数据集的形状

在实际数据处理中，我们经常需要检查数据集的形状，以便了解数据集的规模和特征。使用 Pandas 的 shape 属性，我们可以快速查看数据集的行列数。例如，我们有一张包含学生信息的数据表 Student.csv，我们可以使用 Pandas 加载数据并查看数据集的形状，代码如下：

import pandas as pd

df_student = pd.read_csv('Student.csv')

print(df_student.shape)

确认数据清理后的结果是否符合预期

在数据清洗之后，我们需要根据需要检查数据集的形状是否符合预期，以确保数据清洗的有效性。使用 Pandas 的 shape 属性，我们可以快速比较清洗前后的数据集的形状。例如，我们有一张包含学生信息的数据表 Student.csv，其中包含了姓名、学号、年级、成绩等信息。假设在数据清洗中，我们删除了一部分不合规的数据，我们可以使用 Pandas 查看清洗后的数据集的形状是否符合预期，代码如下：

import pandas as pd

# 加载原始数据
df_student = pd.read_csv('Student.csv')

# 清洗数据后得到新数据
df_cleaned = df_student.dropna() # 假设我们要删除缺失值

# 比较数据清洗前后的 DataFrame 形状
print(df_student.shape)
print(df_cleaned.shape)

获取 DataFrame 的行数、列数

除了使用行列数的元组，在某些情况下，我们需要获取 DataFrame 的行数和列数。使用 Pandas 的 shape 属性，在获取 DataFrame 的行数和列数非常方便。例如，我们有一张包含学生信息的数据表 Student.csv，我们可以使用 Pandas 查看该 DataFrame 的行数和列数，代码如下：

import pandas as pd

df_student = pd.read_csv('Student.csv')

# 获取行数
row_count = df_student.shape[0]

# 获取列数
column_count = df_student.shape[1]

print('行数为：', row_count)
print('列数为：', column_count)

结论

Pandas DataFrame 是一种常用的二维数组数据结构，通过 DataFrame 中的相关属性和方法，我们可以方便地处理数据，进行数据分析和操作。其中，shape 属性是一个非常重要的属性，可以快速查看 DataFrame 的形状，即行数和列数。在数据分析和操作中，了解 DataFrame 的形状对于理解数据的特征、分析数据的关系以及处理数据的方法至关重要。

通过本篇文章的介绍，我们学习了如何使用 Pandas 的 shape 属性来获取 DataFrame 的形状，了解了在数据分析和操作中 shape 属性的常见用途。希望这篇文章能够对你学习 Pandas 数据处理有所帮助。