在Matplotlib中使用Python Pandas数据框绘制95%置信区间误差棒图

介绍

在数据分析和可视化过程中，显示误差范围是很重要的。误差棒图是一种简单有效的方法，可以方便地显示样本均值和置信区间。本文将讨论如何使用Matplotlib和Python Pandas数据框来绘制95%置信区间误差棒图。

步骤

导入所需的库

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

创建数据框

np.random.seed(1234)
df = pd.DataFrame({
    'condition': ['A', 'B', 'C', 'D'],
    'mean': np.random.randn(4),
    'stddev': np.random.rand(4),
    'sample_size': np.random.randint(10, 20, 4)
})
df['stderr'] = df['stddev']/np.sqrt(df['sample_size'])
df['ci'] = 1.96*df['stderr']  #计算置信区间半径

以上代码将创建一个包含四行的数据框，每一行表示一组数据的平均值、标准误、标准偏差、样本大小以及95% 的置信区间。

绘制误差棒图

#创建绘图
fig, ax = plt.subplots()

#画线
plt.errorbar(df['condition'], df['mean'], yerr=df['ci'], fmt='o', markersize=8, capsize=4)

#添加标题和标签
plt.title('95% Confidence Intervals for Conditions')
plt.xlabel('Conditions')
plt.ylabel('Mean Response')

#调整坐标轴范围
plt.ylim(-3, 3)

plt.show()

以上代码将绘制误差棒图，其中包括每个条件的样本均值和95%的置信区间，以及x轴和y轴标签和标题。