NumPy 计算给定数组的均值、标准差和方差
均值、标准差和方差是描述给定数据集分布的统计量。在Numpy库中,我们有函数来计算数组的均值、标准差和方差。让我们逐一详细讨论。
均值
均值也被称为平均值,它是数组中所有元素的总和除以元素的总数。它用于表示数据的中心趋势。
语法
以下是在数组上应用均值函数的语法 –
numpy.mean(arr)
在以下示例中,我们使用 mean() 函数来计算给定输入的一维数组的平均值。
- Numpy 是库。
- mean 是函数。
- arr 是输入的数组。
import numpy as np
a = np.array([22,1,7,14,5,2])
print("The input array:",a)
mean_array = np.mean(a)
print("The mean of the given input array:",mean_array)
输出
以下是给定输入数组的平均值的输出。
The input array: [22 1 7 14 5 2]
The mean of the given input array: 8.5
示例
让我们看一个使用Numpy数组的mean()函数计算2维数组均值的另一个示例。
import numpy as np
a = np.array([[34,23],[90,34],[43,23],[10,34]])
print("The input array:",a)
mean_array = np.mean(a)
print("The mean of the given input 2-d array:",mean_array)
输出
当我们运行上面的代码时,以下是代码的输出结果 –
The input array: [[34 23]
[90 34]
[43 23]
[10 34]]
The mean of the given input 2-d array: 36.375
示例
在这里,我们使用Numpy数组的mean()函数计算3维数组的平均值。
import numpy as np
a = np.array([[[34,23],[90,34]],[[43,23],[10,34]]])
print("The input array:",a)
mean_array = np.mean(a)
print("The mean of the given input 3-d array:",mean_array)
输出
The input array: [[[34 23]
[90 34]]
[[43 23]
[10 34]]]
The mean of the given input 3-d array: 36.375
方差
这用于确定数据在给定数据集中的分布情况。它被计算为每个数据点与它们的均值之间的差的平方的平均值。数学上,计算方差的公式如下所示。
Variance = (1/n) * sum((xi - mean)2)
其中,
- n是数据点的数量。
-
xi是给定数据的第i个数据点。
-
mean是给定数据的平均值。
-
高方差。
高方差
高方差表示数据值在一个大范围内分散,而低方差表示值聚集在数据值的平均值周围。在Numpy中,我们使用var()函数来计算给定数组的方差。
语法
使用方差函数计算数组的语法如下。
numpy.var(arr)
在下面的例子中,我们尝试使用numpy的var()函数来计算一个1维数组的方差 –
import numpy as np
a = np.array([2,7,50,3,12])
print("The input array:",a)
variance = np.var(a)
print("The variance of the given input 1-d array:", variance)
输出
The input array: [ 2 7 50 3 12]
The variance of the given input 1-d array: 322.16
示例
让我们看另一个例子,使用var()函数计算2维数组的方差。
import numpy as np
a = np.array([[90,34],[43,23]])
print("The input array:",a)
variance = np.var(a)
print("The variance of the given input 2-d array:",variance)
输出
The input array: [[90 34]
[43 23]]
The variance of the given input 2-d array: 652.25
标准差
标准差定义了数据离均值的分散程度,告诉我们数据与均值的偏差量。该方法的数学公式如下。
Standard deviation = √(Σ(xi - x)2 / (n - 1))
其中,
- n 是数据点的个数。
-
Σ(xi – x)2 是每个数据值与平均值之间差的平方和。
使用Python计算标准差
在Python的统计模块中,我们有一个名为stdev()的函数,可以用于计算给定数组的标准差。
示例
在以下示例中,我们尝试通过将一维数组传递给stdev()函数来计算数组的标准差 –
import statistics
import numpy as np
a = np.array([34,23,90,34,90,34,43,23])
print("The input array:",a)
std = statistics.stdev(a)
print("The standard deviation of the given input 1-d array:",std)
输出
以下是计算给定输入数组的标准差的输出结果。
The input array: [34 23 90 34 90 34 43 23]
The standard deviation of the given input 1-d array: 27.694764848252458