Nature | 多种群遗传分析有助于揭示复杂性状

科技工作者之家 2019-06-22

来源:BioArt


全基因组关联分析(genome-wide association study,GWAS)是在人类全基因组范围内找出变异的序列,即单核苷酸多态性(SNP),并筛选出与疾病相关的SNPs。GWAS可为研究生物体复杂性状、药物研发和临床参考等提供基础信息。目前大部分的发现均基于欧洲血统的人群数据,而不同的种群存在不同的基因结构,这种代表性上的偏差将会加剧现有的疾病和医疗上的差异【1,2】。仅仅基于欧洲血统的人群数据分析容易丢失少数族裔特异性的变异,而且得出的效应量和风险预测得分直接套用到其他种群是不准确的【3,4】。如何扩展种群数据,如何改进分析方法,使分析结果更精确还需要进一步的研究。

2019年6月20日,来自美国西奈山Icahn医学院的Eimear E. Kenny和美国Fred Hutchinson癌症研究中心的Christopher S. Carlson合作在Nature杂志上发表文章Genetic analyses of diverse populations improves discovery for complex traits证明了多种群的大规模基因研究的价值,不仅能够鉴定新的变异位点,还有助于缩小SNP范围,从而更深入地了解关联疾病;同时还揭示了复杂性状在基因变异水平上的种群特异性,有助于减少种群间在健康问题的差异。

20190622121238_6da12a.jpg

为了减少以欧洲血统种群数据为主的代表性偏差,研究纳入拉美裔社区健康研究/拉美裔研究(Hispanic Community Health Study/Study of Latinos (HCHS/SOL))、妇女健康倡议(Women’s Health Initiative (WHI))、多种群队列研究等三个队列研究和纽约西奈山伊坎医学院生物库(the Icahn School of Medicine at Mount Sinai BioMe biobank)的数据,总计包括了拉美裔(n=22216)、非裔美国人(n=17299)、亚裔(n=4680)、夏威夷人(n=3940)、美国原住民(n=652)、其他(n=1052)。采用PAGE研究(The Population Architecture using Genomics and Epidemiology)方法对26个临床和行为表型进行综合分析,并使用SUGEN和GENESIS等分析工具对种群结构、个体和种群特异性的基因异质性关系进行建模。结果显示联合分析方法优于meta分析,鉴定出16种新的全基因组显著性状-变异关联和11种具有提示性关联的低频位点。在曾被NHGRI-EBI GWAS Catalog数据库收录的范围内,鉴定出32种显著性状-变异关联和6种具有提示性关联的低频位点,加深了我们对于复杂性状的基因结构的理解。同时研究发现部分性状-变异关联具有种群差异性,如SNP(rs182996728)不仅和每天吸烟的支数相关,而且和土著夏威夷/太平洋岛民血统相关,其在大部分的种群中不存在或极罕见,但在土著夏威夷中有17.2%。

GWAS鉴定出的变异-性状关联是否能够直接迁移到非欧洲血统种群?PAGE联合分析能够检测到部分GWAS数据发表的变异,如8979个已知的变异-性状关联中检测到1444个具有显著差异的。比较PAGE分析和GWAS两者间的效应量(衡量处理效应大小的指标),PAGE显著弱于之前报道的;加入种群的因素后,拉美裔的效应量显著降低,非裔美国人的效应量几乎降一半。将GIANT(欧洲血统种群分析)和PAGE或者UK Biobank中白种英国人(UKB50k)进行荟萃分析,研究发现PVE的比例(phenotypic variance explained)—对精准化医疗有重要影响,有显著变化。单纯扩大欧洲血统种群样本数量可以鉴定出更多的变异,解释种群的异质性,但同时降低对种群特异性性状的解释力度,加剧非欧洲血统种群遗传知识的现有差异。

多种群的数据分析有助于更好地定位有功能的多态性位点。以身高为例,GIANT共报道了390个相关变异,PAGE+GIANT的联合分析将95%可信集合从GIANT的平均11.94个SNPs缩小到9.68个,而且增加最高SNP的事后概率(posterior probabilities);而UKB50k(白种英国人)+GIANT(欧洲血统种群)联合分析则没有这种效果。以DOT1L的内含子变异rs11880992为例,PAGE+GIANT将95%可信集合的4个SNP缩小到1个,消除了这些SNP在非裔美国人和拉美裔种群中的低连锁不平衡(low linkage disequilibrium)

总的来说,本研究阐释了多种群数据对大规模基因分析的重要性,并搭建了多种群数据的分析框架。多种群数据的纳入有助于精准医疗、个性化用药,最大程度地挖掘基因变异,降低种群间健康的差异。

原文链接:

https://doi.org/10.1038/s41586-019-1310-4


参考文献

1. Gravel, S. et al. Demographic history and rare allele sharing among human populations. Proc. Natl Acad. Sci. USA 108, 11983–11988 (2011).

2. The SIGMA Type 2 Diabetes Consortium. Association of a low-frequency variant in HNF1A with type 2 diabetes in a Latino population. J. Am. Med. Assoc. 311, 2305–2314 (2014).

3. Carlson, C. S. et al. Generalization and dilution of association results from European GWAS in populations of non-European ancestry: the PAGE study. PLoS Biol. 11, e1001661 (2013).

4. Martin,A.R.etal.Humandemographichistoryimpactsgeneticriskprediction across diverse populations. Am. J. Hum. Genet. 100, 635–649 (2017).

来源:BioGossip BioArt

原文链接:http://mp.weixin.qq.com/s?__biz=MzA3MzQyNjY1MQ==&mid=2652471574&idx=4&sn=cc5d15e6d89b8b525c496fe55fdf96af&chksm=84e212a2b3959bb442c740c2d4ee01451c8560bd06a034111f800d3431ba3c74543ac51fd73e&scene=27#wechat_redirect

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

Nature 遗传变异

推荐资讯