今天推一篇做系统聚类的,使用软件是SPSS,这个软件的学习,要具备一定的统计学知识,聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。
聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。
聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。
选取全国31个省份的经济指标,欲将全国的经济水平分为不同的类别。
选取数据如下:
打开SPSS,依次点击分析→分类→系统聚类。
将选取的变量导入,以地区作为个案标注依据。
在图中选择谱系图,从直观上判断分类情况。
聚类方法选择瓦尔德法,由于各经济变量单位不同,选择马氏距离,消除量纲的影响。
我们得出的结果如下图所示。
直观上,我们可以将全国分为经济发达、较发达、一般、落后四类。
从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等,相关的聚类方法可以进一步探索。
版权声明:我们致力于保护作者版权,注重分享,被刊用文章【spss数据分析案例(SPSS数据分析)】因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!;
工作时间:8:00-18:00
客服电话
电子邮件
beimuxi@protonmail.com
扫码二维码
获取最新动态
