Pandas 如何使用Series.cov()方法找到协方差
在pandas中,Series.cov()方法用于通过排除null/NA或缺失值来计算系列与其他系列的协方差。
协方差是计算两个随机变量之间关系的一种方法,它告诉我们两个随机变量如何共同变化。
这个cov()方法的输出是一个浮点值,表示两个系列之间的协方差。
该方法有三个参数,即other、min_period和ddof。
示例1
import pandas as pd
import numpy as np
# create pandas Series1
series1 = pd.Series([12,34,65,21])
print("First series object:",series1)
# create pandas Series2
series2 = pd.Series([9,78,62,12])
print("Second series object:",series2)
# calculate the covariance value
print("The covariance value: ", series1.cov(series2))
解释
我们使用一个整数列表初始化了两个pandas Series对象series1和series2,然后通过应用cov()方法计算了协方差。
输出
First series object:
0 12
1 34
2 65
3 21
dtype: int64
Second series object:
0 9
1 78
2 62
3 12
dtype: int64
The covariance value: 576.3333333333333
上述示例的协方差为576.33,显示在上面的输出块中。
示例2
import pandas as pd
import numpy as np
# create pandas Series1
series1 = pd.Series([89,np.nan,74,91,100])
print("First series object:",series1)
# create pandas Series2
series2 = pd.Series([93,54,21,80,42])
print("Second series object:",series2)
# calculate the covariance value
print("The covariance value: ", series1.cov(series2, min_periods=3))
解释
在下面的示例中,我们计算两个系列对象之间的协方差,这里给定的一系列对象中存在NaN值。
输出
First series object:
0 89.0
1 NaN
2 74.0
3 91.0
4 100.0
dtype: float64
Second series object: 0 93
1 54
2 21
3 80
4 42
dtype: int64
The covariance value: 141.66666666666666
series.cov()方法在计算系列之间的协方差时排除NaN值。对于上面的示例,协方差是“141.666”。