Python Pandas ō ō Count the rows and columns in a DataFrame
在使用Python Pandas时,我们经常需要统计DataFrame的行数和列数。在这篇文章中,我们会介绍如何使用Pandas自带的属性和方法来实现这个功能。我们会通过一些具体的示例代码来演示这个过程。
更多Pandas相关文章,请阅读:Pandas 教程
Pandas DataFrame
Pandas是一个开源的数据分析工具,它提供了大量能够处理和清洗数据的函数和方法。DataFrame是其中一个非常重要的数据结构,它类似于一个Excel表格,由多行多列组成。Pandas提供了一些非常方便的方法来处理这种数据结构。在这篇文章中,我们主要关注如何统计DataFrame的行数和列数。
下面是一个示例的DataFrame:
import pandas as pd
data = {"Name": ["Alice", "Bob", "Charlie", "David", "Eric"],
"Age": [25, 30, 45, 22, 35],
"Gender": ["Female", "Male", "Male", "Male", "Male"],
"City": ["New York", "Paris", "London", "Paris", "Tokyo"]}
df = pd.DataFrame(data)
print(df)
输出结果:
Name Age Gender City
0 Alice 25 Female New York
1 Bob 30 Male Paris
2 Charlie 45 Male London
3 David 22 Male Paris
4 Eric 35 Male Tokyo
我们可以看到这个DataFrame有4列5行。
统计DataFrame的行数和列数
我们可以使用一些Pandas的属性和方法来统计DataFrame的行数和列数。下面是其中几个常用的方法:
- shape:返回一个元组,其中包含DataFrame的行数和列数。
- len:返回DataFrame的行数。
- columns:返回列名列表。
- index:返回行标签列表。
让我们来看一下具体的示例代码:
# 获取行数和列数
print("Shape:", df.shape)
# 获取行数
print("Number of rows:", len(df))
# 获取列名列表
print("Columns:", list(df.columns))
# 获取行标签列表
print("Index:", list(df.index))
输出结果:
Shape: (5, 4)
Number of rows: 5
Columns: ['Name', 'Age', 'Gender', 'City']
Index: [0, 1, 2, 3, 4]
可以看到,我们使用shape属性获取了DataFrame的行数和列数,len方法获取了行数,columns方法获取了列名列表,而index方法获取了行标签列表。
除了以上方法,我们还可以使用axes属性。axes返回一个元组,其中包含行轴和列轴。我们可以使用len和索引来确定DataFrame的行数和列数,如下所示:
# 使用axes属性获取行轴和列轴
print("Axes:", df.axes)
# 获取行数和列数
print("Number of rows:", len(df.axes[0]))
print("Number of columns:", len(df.axes[1]))
输出结果:
Axes: [RangeIndex(start=0, stop=5, step=1), Index(['Name', 'Age', 'Gender', 'City'], dtype='object')]
Number of rows: 5
Number of columns: 4
结论
通过以上示例代码,我们学习了如何使用Pandas自带的属性和方法来统计DataFrame的行数和列数。这是在使用Pandas进行数据清洗和分析时非常实用的技巧。即使是非常大的数据集,也可以轻松地使用这些方法获取DataFrame的行数和列数。