云生信学生物信息学 关注我们
以下文章来源于A科研显微镜 ,作者eryun
PCA
Principal component analysis
在拿到测序公司给的生信分析报告的时候,我们可能会看到一张主成分分析(principal component analysis,PCA)图。
也许你在结果解读的时候不知道怎么描述?
大部分就写成组与组之间存在显著分离,然后就没啦,这样是不是有点过于单薄。
如何才能读懂PCA图的组成部分,并且写出完整的结果描述呢?看完这篇就知道啦。
概述
一般来说,研究中涉及一个变量,两个变量以及三个变量时,可以分别绘制成一维,二维,和三维空间图来展示结果。
然而,涉及到多个变量时,结果过于复杂,无法准确的展示。
这时,用到PCA分析的关键一步,降维。
简单来说,通过减少数据中的变量来化简数据;这里的减少指标,并不是随意加减,而是用复杂的数理知识,得到几个“综合指标”来代表整个数据,这个综合指标就是所谓的主成分!
下面我们分类型来举例说明下
简单的两组比较
先观察一下图片中的组成成分,主要包括主成分和样本点。
每组的样本都用圆圈进行聚类,每个部分代表的内容如图所示。
图片来源于:PMCID: PMC7011317
多组处理比较
图片来源于:PMCID: PMC7585944
PCA biplot(涉及箭头)
图片来源于:PMCID: PMC8085102
其他类型
两个线条之间的夹角,可理解为两个变量之间的相关性
夹角小于90度,可以认为两个变量正相关
大于90度,可以认为两个变量负相关。
图片来源于:PMCID: PMC8224010
通过某个变量所代表的线条在PC1和PC2上的投影,我们可以看出这个变量对样本分离的贡献度,线条越长,代表投影越大,影响越显著。
图片来源于:PMID: 29723835
小结
PCA常见图片的结果解读就到这里啦,从实战中更清晰的了解PCA图。
相信阅读完以后,对于写作会有一定的帮助。
总的来说,描述的时候不仅要考虑样本的重复性,还要观察该结果的生物学意义。
搞清楚原理后,不管遇到什么样的PCA图,都可以应对的游刃有余了。
如果您在日常学习和工作中遇到什么问题,欢迎在下方留言哦。
另外,关注我们,定期为大家分享一些相关干货知识,欢迎关注和转发~
版权声明:我们致力于保护作者版权,注重分享,被刊用文章【主成分分析经典案例(跟着SCI文献读懂PCA图片的内容和原理)】因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!;
工作时间:8:00-18:00
客服电话
电子邮件
beimuxi@protonmail.com
扫码二维码
获取最新动态
