如何在Python中执行单因素方差分析(One-Way ANOVA)
Python中的单因素方差分析 单因素方差分析(也称为”方差分析”)是一种可以用来确定不同组结果之间是否存在显著统计差异的测试方法。
假设
单因素方差分析基于以下备择假设和零假设:
- H0(零假设)的公式为:m1 = M2 = m3 … = MK(这意味着全部样本均值相等)
- H1(备择假设)规定至多一个不同总体存在
说明
研究人员选取了20辆相同的车辆参加研究。这些车辆随机加入了四种不同的发动机油,然后每辆车被允许自由行驶100英里。之后,记录了每辆车的性能。在继续之前,我们的命令要求将SciPy库添加到我们的系统中。可以通过从终端运行以下命令来安装该库:
pip3 install scipy
逐步实施
使用Python进行单向ANOVA测试是一个分阶段的过程。各个步骤如下所述:
步骤1: 创建数据组。
步骤1是创建三个数组来保留汽车行驶的详细信息。
# here are the performance when each of the engine oil is applied
performance_1 = [99, 99, 98, 88, 89]
performance_2 = [83, 82, 84, 79, 78]
performance_3 = [79, 78, 79, 83, 80]
performance_4 = [71, 88, 71, 82, 92]
步骤2: 进行一元方差分析:
Python提供了SciPy库的f_oneway()函数,使用这个函数我们可以使用一元方法进行方差分析。
# first, we will import the f_oneway library fromscipy.stats
from scipy.stats import f_oneway as FO
# Here are the erformance when each of the engine oil is applied
performance_1 = [99, 99, 98, 88, 89]
performance_2 = [83, 82, 84, 79, 78]
performance_3 = [79, 78, 79, 83, 80]
performance_4 = [71, 88, 71, 82, 92]
# Now, we will conduct the one-way ANOVA
FO(performance_1, performance_2, performance_3, performance_4)
输出:
F_onewayResult(statistic=7.34325396825397, pvalue=0.002591682084345443)
步骤3. 分析结果:
最后,F统计量和p值的计算结果都为4.625和0.016336498,相应地。 p值不能小于0.5。因此,我们无法证明我们的零假设。这表明我们没有足够的证据来得出在引擎的四种不同油品之间存在改进性能的结论。