卡方分布的解释-排行榜大全

若n个相互独立的随机变量，均服从标准正态分布，则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量，其分布规律称为卡方分布。

不同的自由度决定不同的卡方分布，自由度越小，分布越偏斜。

卡方分布（英语：chi-square distribution[2], χ²-distribution，或写作χ²分布）是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。

卡方分布是一种特殊的伽玛分布，是统计推断中应用最为广泛的概率分布之一，例如假设检验和置信区间的计算。

卡方分布在共同使用卡方检验用于拟合优度的观测分布为理论之一，独立的分类的两个标准定性数据，并在用于人口区间估计标准偏差a的来自样本标准差的正态分布。许多其他统计检验也使用这种分布，例如Friedman 的按秩方差分析。

由卡方分布延伸出来皮尔逊卡方检验常用于：

1、样本某性质的比例分布与总体理论分布的拟合优度（例如某行政机关男女比是否符合该机关所在城镇的男女比）；

2、同一总体的两个随机变量是否独立（例如人的身高与交通违规的关联性）；

3、二或多个总体同一属性的同素性检验（意大利面店和寿司店的营业额有没有差距）。（详见皮尔逊卡方检验）

计算方法

p-value = 1- p_CDF.

χ2越大，p-value越小，则可信度越高。通常用p=0.05作为阈值，即95%的可信度。

因此，由于适当自由度(df)的累积分布函数(CDF)给出了获得比该点更不极端的值的概率，因此从 1 中减去 CDF 值给出p值。低于所选显着性水平的低p值表示统计显着性，即有足够的证据拒绝零假设。显着性水平 0.05 通常用作显着和不显着结果之间的分界点。

卡方分布的期望和方差是：E(X)=n，D(X)=2n

t分布：E(X)=0(n>1)，D(X)=n/(n-2)(n>2)

F(m,n)分布：E(X)=n/(n-2)(n>2)

D(X)=[2n^2*(m+n-2)]/[m(n-2)^2*(n-4)](n>4)

卡方分布(χ2分布)是概率论与统计学中常用的一种概率分布，k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布，卡方分布常用于假设检验和置信区间的计算。

正态分布的密度函数的特点是：关于μ对称，在μ处达到最大值，在正（负）无穷远处取值为0，在μ±σ处有拐点。它的形状是中间高两边低，图像是一条位于x轴上方的钟形曲线。当μ＝0，σ2＝1时，称为标准正态分布，记为N（0，1）。

二项分布：

在每次试验中只有两种可能的结果，而且两种结果发生与否互相对立，并且相互独立，与其它各次试验结果无关，事件发生与否的概率在每一次独立试验中都保持不变，则这一系列试验总称为n重伯努利实验，当试验次数为1时，二项分布服从0-1分布。

若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ，均服从标准正态分布（也称独立同分布于标准正态分布），则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量，其分布规律称为卡方分布。

卡方分布的解释