Python DataFrame 行数
在 Pandas 中,DataFrame 是一个二维的、表格形式的数据结构,类似于电子表格或 SQL 数据表。DataFrame 由多个行和列组成,可以存储不同类型的数据。在数据处理和分析中,了解 DataFrame 的行数是非常重要的,因为行数反映了数据集的大小和复杂度。
获取 DataFrame 行数
获取 DataFrame 的行数可以通过多种方法实现,下面将介绍几种常用的方法:
方法一:使用 len()
函数
可以使用 Python 的内置函数 len()
来获取 DataFrame 的行数。以下是示例代码:
import pandas as pd
# 创建一个示例 DataFrame
data = {'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e']}
df = pd.DataFrame(data)
# 获取 DataFrame 的行数
row_count = len(df)
print("DataFrame 的行数为:", row_count)
运行以上代码,输出为:
DataFrame 的行数为: 5
方法二:使用 shape
属性
DataFrame 有一个 shape
属性,返回一个元组,其中第一个元素表示行数,第二个元素表示列数。可以通过访问元组的第一个元素来获取 DataFrame 的行数。以下是示例代码:
import pandas as pd
# 创建一个示例 DataFrame
data = {'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e']}
df = pd.DataFrame(data)
# 获取 DataFrame 的行数
row_count = df.shape[0]
print("DataFrame 的行数为:", row_count)
运行以上代码,输出为:
DataFrame 的行数为: 5
方法三:使用 info()
方法
Pandas 中的 DataFrame 对象有一个 info()
方法,可以打印有关 DataFrame 的摘要信息,包括行数和列数。可以从输出中直接获取 DataFrame 的行数。以下是示例代码:
import pandas as pd
# 创建一个示例 DataFrame
data = {'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e']}
df = pd.DataFrame(data)
# 使用 info() 方法获取 DataFrame 的摘要信息
df.info()
运行以上代码,输出中包含了 DataFrame 的行数信息,如下所示:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5 entries, 0 to 4
Data columns (total 2 columns):
A 5 non-null int64
B 5 non-null object
dtypes: int64(1), object(1)
memory usage: 208.0+ bytes
从输出中可以看到,该 DataFrame 共有 5 行数据。
总结
行数是一个数据集的重要指标,它反映了数据集的大小和复杂度。在 Pandas 中,我们可以通过 len()
函数、shape
属性或 info()
方法来轻松获取 DataFrame 的行数。掌握这些方法,有助于我们更好地理解和处理数据集。