python 中的标准差拟合|极客笔记

python 中的标准差拟合

在统计学中，标准差是一种用来衡量数据离散程度的指标。在数据分析和机器学习中，经常会用到标准差拟合这一技术来分析数据的离散程度。本文将详细介绍在 Python 中如何使用标准差拟合来分析数据。

什么是标准差？

标准差是描述一组数据离散程度的一种统计量。标准差越大，数据的离散程度就越大；标准差越小，数据的离散程度就越小。标准差的数学定义如下：

$\sigma = \sqrt{\frac{\sum_{i=1}^n (x_i – \mu)^2}{n}}$

其中， $x_i$ 是第 $i$ 个数据点， $\mu$ 是数据的平均值， $n$ 是数据的个数。

Python 中有许多库可以用来计算数据的标准差，例如 NumPy 和 pandas。接下来我们将通过一个示例来详细介绍如何使用这些库来进行标准差拟合。

标准差拟合的示例

假设我们有一个包含 100 个随机生成的正态分布数据的列表。我们将使用 NumPy 库来计算这组数据的标准差，并使用 matplotlib 库来绘制数据的直方图。

import numpy as np
import matplotlib.pyplot as plt

# 生成随机数据
data = np.random.normal(0, 1, 100)

# 计算标准差
std = np.std(data)

# 绘制直方图
plt.hist(data, bins=20, color='skyblue', edgecolor='black')
plt.axvline(np.mean(data), color='red', linestyle='dashed', linewidth=2)
plt.axvline(np.mean(data) + std, color='green', linestyle='dashed', linewidth=2)
plt.axvline(np.mean(data) - std, color='green', linestyle='dashed', linewidth=2)

plt.show()

在上面的示例中，我们首先生成 100 个服从标准正态分布的随机数据，并计算这组数据的标准差。然后，我们使用 matplotlib 库绘制了数据的直方图，并在图中加入了平均值和标准差线。