Python 如何执行F检验

Python 如何执行F检验

统计学家使用F检验来检查两个数据集的方差是否相等。F检验以罗纳德·费舍尔爵士的名字命名。为了使用F检验,我们提出了一个无效假设和一个备择假设,然后我们通过F检验选择这两个假设中的任何一个。

方差是一个数据分布度量,用于告诉数据相对于均值的偏离程度。较高的值显示比较小的值更加分散。

在本文中,您将学习如何使用Python编程语言执行F检验以及其用例。

F-Test过程

执行F-Test的步骤如下:

  • 首先,定义无效假设和备择假设。
    • 无效假设或H0: σ₁² = σ₂²(总体的方差相等)

    • 备择假设或H1: σ₁² ≠ σ₂²(总体的方差不相等)

  • 选择用于测试的统计量。

  • 计算总体的自由度。例如,如果m和n是总体形状,则自由度表示为 (df1) = m-1(df2) = n-1

  • 现在从F表中找到F值。

  • 最后,将α值除以2以计算双侧检验的临界值。

因此,我们使用总体的自由度来定义F值。我们在第一行读取df1,而在第一列中读取df2。

不同类型的自由度有各种F表。我们将步骤2中的F统计量与步骤4中计算的临界值进行比较。如果临界值小于F统计量,则可以拒绝无效假设。相反,如果某个显著水平上的临界值大于F统计量,则可以接受无效假设。

Python 如何执行F检验

假设

在基于数据集进行F检验之前,我们做出一些假设。

  • 数据总体遵循正态分布,即符合钟形曲线。

  • 样本之间没有相关性,即总体中没有多重共线性。

除了这些假设之外,在执行F检验时,还应考虑以下关键点:

  • 最大方差值应在分子中,以进行右尾检验。

  • 在双尾检验中,将alpha除以2后确定临界值。

  • 检查您是否有方差或标准偏差。

  • 如果在F表中没有自由度,则将最大值作为临界值。

Python中的F-Test

语法

scipy stats.f()

参数

x :  quantiles
q :  lower or upper tail probability
dfn, dfd shape parameters
loc :location parameter
scale :  scale parameter (default=1)
size :  random variate shape
moments : [‘mvsk’] letters, specifying which moments to compute

解释

在这种方法中,用户必须将每个数组的f_value和iterable length传递给scipy.stats.f.cdf(),并从1中减去它以执行F-test。

步骤

  • 首先,导入NumPy和Scipy.stats库进行操作。

  • 然后,创建两个随机选择的值的列表,使用两个不同的变量名将它们转换为NumPy数组,并使用Numpy计算每个数组的方差。

  • 定义一个函数来计算F得分,首先我们对数组的自由度进行方差的除法。

  • 然后计算每个数组的可迭代长度,并将f-value(方差比率)和长度传递给CDF函数,并从1中减去这个值来计算p-value。

  • 最后,函数返回p_value和f_value。

示例

import numpy as np
import scipy.stats

# Create data
group1 = [0.28, 0.2, 0.26, 0.28, 0.5]
group2 = [0.2, 0.23, 0.26, 0.21, 0.23]

# Converting the list to an array
x = np.array(group1)
y = np.array(group2)

# Calculate the variance of each group
print(np.var(group1), np.var(group2))

def f_test(group1, group2):
   f = np.var(group1, ddof=1)/np.var(group2, ddof=1)
   nun = x.size-1
   dun = y.size-1
   p_value = 1-scipy.stats.f.cdf(f, nun, dun)
   return f, p_value

# perform F-test
f_test(x, y)

输出

Variances: 0.010464 0.00042400000000000017

你可以观察到F检验值为 4.38712 ,相应的p值为 0.019127

由于p值小于0.05,我们会放弃原假设。因此,我们可以说这两个总体的方差不相等。

结论

阅读完本文后,你现在知道如何使用F检验来检查两个样本是否属于具有相同方差的总体。你已经了解了F检验的过程、假设和Python实现。让我们用几个要点总结一下本文——

  • F检验告诉你两个总体是否具有相等的方差。

  • 计算自由度并计算临界值。

  • 从F-Table中找到F统计量,并将其与前一步计算的临界值进行比较。

  • 根据临界值和F统计量的比较接受或拒绝原假设。

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程