Pandas series.describe方法的使用是什么
pandas.series中的describe()方法用于生成series对象的统计描述。此方法分析数字和目标系列的描述。
因此,describe()方法返回系列的摘要统计信息。它的结果取决于输入系列对象的类型。
对于数字系列,describe()方法分析基本统计信息,如计数、平均值、标准差、最小值、最大值和分位数(25%、50%和75%)。50%的分位数与中位数相同。
如果系列对象的数据类型为object,describe()方法分析基本统计信息,如计数、唯一值、最常出现的值和频率。
示例1
# importing required packages
import pandas as pd
# creating pandas Series object
series = pd.Series([9,2,3,5,8,9,1,4,6])
print(series)
# apply describe method
print("output",series.describe())
说明
首先,我们使用Python列表创建了一个pandas Series,其中包含整数值。然后,通过使用describe()方法分析了该序列对象的统计数据。
输出
0 9
1 2
2 3
3 5
4 8
5 9
6 1
7 4
8 6
dtype: int64
Output count 9.000000
mean 5.222222
std 2.990726
min 1.000000
25% 3.000000
50% 5.000000
75% 8.000000
max 9.000000
dtype: float64
我们对数值系列对象进行了基本统计计算,结果显示在上面的输出块中。计数代表给定系列对象的元素数量。同样,我们分析了均值、最小值、最大值、标准差等。
示例2
# importing required packages
import pandas as pd
# creating pandas Series object
series = pd.Series(['A', 'B', 'E', 'C', 'A', 'D', 'D', 'E', 'F', 'C', 'B', 'A'])
print(series)
# apply describe method
print("Output: ">"",series.describe())
解释
在下面的示例中,我们对一个目标类型的pandas系列进行了统计计算。为此,我们使用字符串列表创建了一个系列对象。
输出
0 A
1 B
2 E
3 C
4 A
5 D
6 D
7 E
8 F
9 C
10 B
11 A
dtype: object
Output count 12
unique 6
top A
freq 3
dtype: object
我们得到了系列元素的计数、唯一值的总数、顶部(最频繁的)元素以及顶部值的频率。