python求标准差|极客笔记

python求标准差

什么是标准差

标准差是用来衡量一组数据的离散程度或者波动程度的统计量。标准差越大，表示数据的离散程度越大；标准差越小，表示数据的离散程度越小。标准差的计算公式如下：

$\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^{N} (x_i – \bar{x})^2}$

其中， $N$ 为数据个数， $x_i$ 为第i个数据点， $\bar{x}$ 为数据的平均值。

如何用Python求标准差

在Python中，我们可以使用numpy库来求一组数据的标准差。下面是一个示例代码：

import numpy as np

data = [1, 2, 3, 4, 5]

std_dev = np.std(data)

print("标准差为:", std_dev)

上面的代码中，我们首先导入numpy库，然后定义了一个包含5个数据点的列表data。接着使用np.std()函数来计算列表data的标准差，并将结果存储在std_dev变量中。最后输出标准差的值。

如果我们运行上面的代码，将会得到输出：

标准差为: 1.4142135623730951

求样本标准差还是总体标准差

在统计学中，标准差分为样本标准差和总体标准差。样本标准差是用来衡量样本数据的离散程度，通常用 $\sigma$ 表示；总体标准差是用来衡量总体数据的离散程度，通常用 $s$ 表示。在numpy库中，np.std()函数默认计算的是样本标准差。如果想要计算总体标准差，可以将ddof参数设为0，示例如下：

import numpy as np

data = [1, 2, 3, 4, 5]

std_dev_population = np.std(data, ddof=0)

print("总体标准差为:", std_dev_population)

这段代码将得到计算总体标准差的结果：

总体标准差为: 1.118033988749895

求多维数组的标准差

除了一维数组之外，我们还可以使用numpy库来求多维数组的标准差。下面是一个示例代码：

import numpy as np

data = np.array([[1, 2, 3],
                 [4, 5, 6],
                 [7, 8, 9]])

std_dev = np.std(data)

print("多维数组的标准差为:", std_dev)

上面的代码中，我们首先导入numpy库，然后定义了一个2维数组data。使用np.std()函数来计算数组data的标准差，并将结果存储在std_dev变量中。最后输出多维数组的标准差的值。

如果我们运行上面的代码，将会得到输出：

多维数组的标准差为: 2.581988897471611

总结

本文介绍了标准差的概念以及如何用Python的numpy库来求一组数据的标准差。

python求标准差