卡方分布的期望和方差的证明（分类数据假设检验）-院校搜

卡方分布的期望和方差的证明（分类数据假设检验）

2025-08-08 23:39:01 阅读 998 评论 0

摘要：在前面一系列检验方法汇总，我们注意到：前面应用的多是连续变量数据。我们也知道变量有不同的类型，包括连续数据、有分类数据、有等级数据。t检验和方差检验是用于比较连续数据的。那如果要比较分类资料的数据，如何进行分析呢？这就是本部分所讲述的卡方检验。检验被誉为二

在前面一系列检验方法汇总，我们注意到：前面应用的多是连续变量数据。我们也知道变量有不同的类型，包括连续数据、有分类数据、有等级数据。t检验和方差检验是用于比较连续数据的。那如果要比较分类资料的数据，如何进行分析呢？这就是本部分所讲述的卡方检验。检验被誉为二十世纪科学技术所有分支中的20大发明之一，它的发明者是卡尔·皮尔逊（Karl Pearson）。其基本思想是真实值与理论值的吻合程度。

卡尔.皮尔逊

简介

卡方检验是用途非常广的一种假设检验方法，它在分类资料统计推断中的应用，主要用于定性资料的统计学处理，如2个或2个以上率或构成比的比较。

所谓定性资料是对每个对象的某些特征或性质通过个数的多少来进行表述或描述而得到的资料。以计数的方式取值（如A组34例，B组33例），或是名义的（如男、女）或是有序的（如Ⅰ期、Ⅱ期、Ⅲ期）。有序的定性资料可称为等级资料。

在表现形式上，常以表格的形式将资料进行归纳与整理，即为列联表。如下表所示，称为二维列联表，也称R×C列联表。

基本原理与思想

卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度，实际观测值与理论推断值之间的偏离程度就决定卡方值的大小，如果卡方值越大，二者偏差程度越大；反之，二者偏差越小；若两个值完全相等时，卡方值就为0，表明理论值完全符合。

它的无效假设H0：观察频数与期望频数没有差别。其基本思想就是：首先假设H0成立，基于此计算卡方值，表示观察值与理论值的偏离程度。根据卡方值的分布及自由度可以确定H0假设成立的情况下获得当前统计量及更极端情况的概率P。若P值很小，说明观察值与理论值偏离程度太大，应当拒绝无效假设，表示比较的资料之间有显著性差异；否则就接受H0，不能认为两者有差别。

卡方检验样本量要求

卡方分布本身是连续型分布，但在分类资料的统计分析中，频数只能以整数形式出现，因此计算出的统计量是非连续的。当样本量充足时，可以忽略差异. 一般认为卡方检验的每个单元格，要求最小期望频数大于1，且至少4/5的单元格期望频数大于5。

卡方检验的用途

检验某个分类变量各类出现的概率是否等于指定概率。如掷硬币时，正反两面的出现的概率是否均为0.5检验某两个分类变量是否相互独立。如吸烟（是/否）是否与呼吸道疾病（是/否）有关；产品原料种类（多分类变量）是否与产品合格（二分类变量）有关检验控制某种/某几种分类因素的作用后，另2个分类变量是否相互独立。如控制性别/年龄因素后，吸烟是否与呼吸道疾病有关检验某两种方法的结果是否一致。如采用两种诊断方法对同一批人进行诊断，其诊断结果是否一致

后续我们将陆续展开分类数据假设检验。

原文链接：https://www.yxiso.com/zhishi/2030394.html

发表评论: