Nat Comm : 周翔组开发单细胞RNA测序数据分析新方法 – iDEA

科技工作者之家 2020-04-19

来源:BioArt

近日,美国密歇根大学、生物统计系周翔副教授课题组(https://www.xzlab.org;博士研究生马莹为第一作者,孙世权博士为共同第一作者)在Nature Communications杂志上发表方法研究型长文:Integrative Differential Expression and Gene Set Enrichment Analysis Using Summary Statistics for scRNA-seq Studies,提出了一种单细胞RNA测序数据(scRNA-seq)差异表达基因和基因富集联合分析的新方法iDEA

基因差异表达(DE)分析和基因集富集(GSE)分析在单细胞RNA测序(scRNA-seq)研究中有着广泛的应用。作者开发了一种集成的、可扩展的计算方法iDEA来执行DE和GSE联合分析。该方法利用层次贝叶斯框架 (Hierarchical Bayesian) 对单细胞RNA测序的概括统计数据(Summary Statistics)进行建模,通过一个内层马尔可夫链蒙特卡罗(MCMC)步骤的期望最大化(EM)算法对该模型进行求解,采用了Louis Method来对EM-MCMC算法估计出来的富集参数(Enrichment Parameter)的信息矩阵(Observed Information)进行校正。

相比于目前常规的基于单细胞RNA测序原始数据建模的DE方法能提高因不同统计模型构架下DE方法识别出来的的差异性表达基因的一致性,并且避免由于分析大规模单细胞RNA测序原始数据而导致的计算复杂性。相比于现有的GSE方法,iDEA能有效地控制第一类错误(Type I Error),提高GSE分析的统计检验效能(Statistical Power)

基于对单细胞RNA测序的概括统计数据(Summary Statistics),iDEA进行了DE分析和GSE的联合分析,通过模型里DE分析结果和GSE分析结果的相互反馈,来提高两种分析的统计检验效能(Statistical Power)和结果的可重复性、一致性,是单细胞RNA测序数据一个快速、有效且灵活的分析工具。

wt_a52342020020060922_20b6ce.jpg

本文通过设计大量的仿真实验 (Simulations) 评估iDEA模型与算法的有效性和优劣性,并且通过三个公开实例数据验证模型与算法的实用性。

这三个实例数据来自不同的物种、组织(人胚胎干细胞,老鼠感觉神经元,人外周血单个核细胞),和三种不同的单细胞测序技术(SMARTer,STRT-Seq ,10x Genomics)

在这三个实例数据上,iDEA 能比现有DE方法提高 64%的统计检验效能,而iDEA的基因集统计检验效更能达到现有GSE方法的五倍。以人胚胎干细胞为例,iDEA识别的差异表达基因是以前DE方法zingeR的1.6倍。这些iDEA多识别出来的基因有明显的生物学意义:热图结果显示这些识别的基因有明显的表达差异,通过与已知人胚胎干细胞标记基因验证,iDEA识别了大量与内胚层干细胞分化(definitive endoderm cell differentiation)相关的基因,其中包括基因SMAD3, GATA3等。

同时,在这个人胚胎干细胞实例数据上,iDEA识别到的基因集是之前GSEA方法的2倍。iDEA识别的基因集中了大量与人胚胎干细胞发展有关基因集,其中transforming growth factor beta (TGF-beta) receptor signaling pathway以及vasculature development。

简而言之,本文提出了一个快速、有效的新方法iDEA,通过数值模拟和实例分析表明该方法可以很好地控制第一类错误,同时识别出差异表达基因和富集的基因集,且具有较高的统计功效。

来源:BioGossip BioArt

原文链接:https://mp.weixin.qq.com/s?__biz=MzA3MzQyNjY1MQ==&mid=2652483496&idx=5&sn=cd320dc1501fd87cf77fc712951b08c8&chksm=84e23c1cb395b50ae4ed44d22ac61f3429576d420d13cda82eab37eb8953c634112d9244f52b#rd

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

数据 基因 方法 单细胞RNA

推荐资讯