spss多元回归分析案例(数据分析中的统计规律之回归分析)

 2025-09-04 15:42:01  阅读 336  评论 0

摘要:通过前三期的学习,我们对大数定律、中心极限定理和随机抽样已经有了一定了解,今天小编继续和大家一起学习统计中的重要方法—回归分析。什么是回归分析?在统计学中,回归分析(regression analysis)用来反映两个及以上变量间数量依存关系的一种统计分析方法。一般地,回归分

通过前三期的学习,我们对大数定律、中心极限定理和随机抽样已经有了一定了解,今天小编继续和大家一起学习统计中的重要方法—回归分析。

什么是回归分析?

在统计学中,回归分析(regression analysis)用来反映两个及以上变量间数量依存关系的一种统计分析方法。

一般地,回归分析分为以下几类:按照因变量的多少,分为一元回归和多元回归分析;按照自变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。

在大数据分析中,回归分析是一种预测性的建模技术,它研究的是因变量(目标变量)和自变量(预测变量)之间的关系。通常用于预测分析,发现变量之间的因果关系。

通俗地讲:回归分析就是通过一个已知的现象来找到未知的原因,通过严格的数学模型发现每种原因对现象结果的贡献比例。

回归分析的数学过程比较复杂,对于看到数学公式就头大的小伙伴们来说,统计软件的输入输出避免了数据计算的复杂,将分析过程变得简单化。我们只需要将多个变量带入回归方程式,通过模型计算结果即可获得所关注的自变量和因变量的线性关系。

通过统计推断结果我们可以获知这些变量在多大程度上影响了因变量。当前学术界绝大多数的研究结论都是以回归分析作为基础的。尤其是回归分析软件的普及,让建立模型变得更为简便,但同时也要注意在进行回归分析时遗漏的变量或者忽视反面因素,回归分析就可能得出危险的结论。

来个栗子:

上世纪90年代,哈佛大学对12万名女性开展了纵向调查,经过严格的回归分析证实,定期摄入雌激素的女性突发心脏病的概率仅为其他女性的1/3。医学研究机构验证了此观点,医院自此开始定期为中老年妇女进行雌激素的补充治疗。

然而,经过后期的临床试验发现,补充雌激素的会导致乳腺癌和血栓病,这是科学家前期未考虑到的重大疏漏,最终因接受雌激素治疗而死亡的女性患者高达上万人,造成悲剧上演。

So, 如果出现数据或因素遗漏,错误的数据结果甚至会造成意想不到的严重后果。

下面我们使用IBM SPSS软件做一个简单的实例,给大家介绍如何使用SPSS实现回归分析。

回归分析的方法包括:线性回归、逻辑回归、多项式回归、逐步回归等很多种,今天我们就拿最常用的线性回归结合案例来给大家讲解:年龄和血压的关系。

回归分析的步骤

确定回归方程中的解释变量(自变量)和被解释变量(因变量);确定回归模型——选择合适的数学模型概括回归线;确定回归方程——根据样本数据及确定的回归模型,在一定的统计拟合准则下估计模型的参数,得到确定的回归方程;对回归方程进行各种检验——基于样本得到的回归方程是否真实反映了总体间的统计关系?回归方程能否用于预测?

一元线性回归模型:

模型说明:

X为自变量;Y为因变量;Y的截距,即常量;斜率为回归系数,表明自变量对因变量的影响程度;

X的变化引起的Y的线性变化部分:

其它随机因素引起的Y的变化部分:

对一元线性回归有所了解以后,我们就用它结合一个简单的案例:年龄和血压的关系。

导入数据

生成散点图

选择"简单散点图",得到以下图形:

通过散点图观察变量间的相关性。如果有多个变量则做出散点图矩阵、重叠散点图和三维散点图。若数据的分布存在明显的非线性关系,我们需要对数据进行预处理或变量变换后再进行后续分析。

建模过程

我们可以这样理解:因变量是结果,自变量是原因。在这个实例中我们可以理解为年龄将会影响血压的高低。

右侧点击"统计"按钮,在弹出的界面做如下勾选:

点击右侧"图"按钮,有些版本叫"绘制",做如下配置:

这两项配置完成后点击主界面的"确定"按钮就可以得到输出结果。

上表中,调整R2就是反映这个模型的拟合度的,简单讲就是我们拟合的两个变量之间的线性方程与两个变量真实之间关系的一个拟合度。拟合度通常是在0-1之间的数字。

ANOVA即是方差分析,主要目的是检验回归模型是否存在统计学意义。显著性也叫Sig,显著性的结果是0.002,说明年龄完全不能影响血压这个假设发生的概率是0.2%,因此我们可以得出结论有99.8%的概率年龄可以显著影响血压的。

上表中,年龄的回归系数为0.881,说明年龄越大血压越高。年龄每增加1岁,血压值将增加0.881,这就是自变量和因变量之间的一个定量的影响关系。判断的依据、数据维度与模型结果的几个关键值都有密切关系,加入分析的自变量是否正确、数量多少等因素对结果也会产生影响。

版权声明:我们致力于保护作者版权,注重分享,被刊用文章【spss多元回归分析案例(数据分析中的统计规律之回归分析)】因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!;

原文链接:https://www.yxiso.com/zhishi/2128810.html

发表评论:

关于我们
院校搜的目标不仅是为用户提供数据和信息,更是成为每一位学子梦想实现的桥梁。我们相信,通过准确的信息与专业的指导,每一位学子都能找到属于自己的教育之路,迈向成功的未来。助力每一个梦想,实现更美好的未来!
联系方式
电话:
地址:广东省中山市
Email:beimuxi@protonmail.com

Copyright © 2022 院校搜 Inc. 保留所有权利。 Powered by BEIMUCMS 3.0.3

页面耗时0.0344秒, 内存占用1.93 MB, 访问数据库24次

陕ICP备14005772号-15