在前面一系列检验方法汇总,我们注意到:前面应用的多是连续变量数据。我们也知道变量有不同的类型,包括连续数据、有分类数据、有等级数据。t检验和方差检验是用于比较连续数据的。那如果要比较分类资料的数据,如何进行分析呢?这就是本部分所讲述的 卡方检验。检验被誉为二十世纪科学技术所有分支中的20大发明之一,它的发明者是卡尔·皮尔逊(Karl Pearson)。其基本思想是真实值与理论值的吻合程度。
卡尔.皮尔逊
卡方检验是用途非常广的一种假设检验方法,它在分类资料统计推断中的应用,主要用于定性资料的统计学处理,如2个或2个以上率或构成比的比较。
所谓定性资料是对每个对象的某些特征或性质通过个数的多少来进行表述或描述而得到的资料。以计数的方式取值(如A组34例,B组33例),或是名义的(如男、女)或是有序的(如Ⅰ期、Ⅱ期、Ⅲ期)。有序的定性资料可称为等级资料。
在表现形式上,常以表格的形式将资料进行归纳与整理,即为列联表。如下表所示,称为二维列联表,也称R×C列联表。
卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。
它的无效假设H0:观察频数与期望频数没有差别。其基本思想就是:首先假设H0成立,基于此计算卡方值,表示观察值与理论值的偏离程度。根据卡方值的分布及自由度可以确定H0假设成立的情况下获得当前统计量及更极端情况的概率P。若P值很小,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较的资料之间有显著性差异;否则就接受H0,不能认为两者有差别。
后续我们将陆续展开分类数据假设检验。
版权声明:我们致力于保护作者版权,注重分享,被刊用文章【卡方分布的期望和方差的证明(分类数据假设检验)】因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!;
工作时间:8:00-18:00
客服电话
电子邮件
beimuxi@protonmail.com
扫码二维码
获取最新动态
