《Cell》不同人群结构变异研究揭示人类结构变异的群体结构、分层和渗入

科技工作者之家 2020-06-17

来源:Nextomics

近日,英国Wellcome Sanger 研究所Yali XueMohamed A. Almarri等研究人员对人类基因组多样性计划(HGDP)数据库中的结构变异进行了全面分析,生成了不同人群的结构变异的综合资源,探索了不同类别的结构变异的结构,描述了区域和种群特有的变异和扩张,发现了可能的基因渗入,并识别了GRCh38参考基因组中缺失的序列,为人类进化和精准医学研究提供了宝贵资源。该研究以“Population Structure, Stratification, and Introgression of Human Structural Variation”为题,在线发表于国际学术期刊《Cell》。

wt_a12302200617223723_3733fa.jpg

结构变异极大地促进了遗传多样性,并且在群体进化和医学研究中有重要意义。先前全球范围的人群结构变异研究都是基于大群体低覆盖度或少数样本,进行广泛的大陆性比较。单个种群较少的样本数量或低覆盖度限制了对每个大陆群体和种群的详细分析,人类基因组多样性计划(HGDP)数据库包含了来自全球54个不同人群的911个样本的高覆盖数据集,为更全面的研究来自不同人群的结构变异提供了机会。
变异鉴定并与已发表数据集比较

HGDP数据库中911份样本的全基因组重测序数据(图1A)平均测序深度36×。将这些序列与人类参考基因组GRCh38比对,共鉴定到126,018个结构变异,其中78%的变异在过去的全球测序项目中未被鉴定到。这些以前未被鉴定到的并不局限于罕见变异,在区域群体和独立种群中发现了相当多的常见甚至高频变异。UMAP分析显示所有类型的遗传变异都显示出群体结构,尤其是缺失变异显示出大陆群体的明显分离(图1B)。

wt_a82322020061723723_3edad4.jpg

1 HGDP数据库和群体结构
群体分层与选择

选择压力可能导致种群之间高度分层的变异,研究者评估了每个群体对的平均群体分化和最大变异等位基因频率差异之间的关系,缺失和插入显示相似的分布,而复等位基因重复显示较低的分层(图2 A-C)。

每个种群中样本数充足的高覆盖率基因组使我们能够识别和估计种群和区域特定变异的频率。研究者在中非木布提人(Mbuti)狩猎-采集群体中发现了一个特有的、频率为54%的缺失变异(图2F)。这一变异删除了SIGLEC5基因,消除了抑制受体的功能,而其相邻的配对受体SIGLEC14没有删除,完整保持了激活受体的功能,抑制受体的缺失可能导致免疫过度活跃和自身免疫性疾病。该变异显示了一个极端的种群分支统计量(PBS;99.87%),存在潜在的正向选择。

wt_a42302020617223724_45772e.jpg

2 结构变异的群体分层

古基因渗入

利用高覆盖率的古人类基因组对获得的变异进行基因分型,尼安德特人和丹尼索瓦人似乎对不同现代人类的功能结构变异有潜在的贡献。研究人员在大洋洲群体中发现了潜在的丹尼索瓦人基因渗入事件,并且至今保持高频率。例如16p12.2位点的重复频率为82%(图2D,E),RNA解旋酶基因AQR中的缺失频率为63%。由于许多已确认的变异都与免疫过程有关,推测它们与现代人在非洲以外的新环境中生存后对病原体的适应有关。

复等位基因变异及重复扩张

研究者在变异数据集中发现了复等位基因变异拷贝数存在动态扩张范围,这些变异在全球范围内大多是低拷贝数,但在某些人群中已经扩展到高拷贝数。例如编码抗锥虫感染相关蛋白的HPR基因,在几乎所有非洲人群中存在扩张(图3A;嗅觉感受器OR7D2基因上游的显著扩张仅发生在东亚地区(图3B);三分之一的亚洲人群脂肪细胞和免疫细胞受体编码基因HCAR2发生扩张(图3C);编码硫转移酶基因SULT1A1在大洋洲人群中扩张更为明显(图3D)。

wt_a12302200617223725_509327.jpg

3 拷贝数扩张和失控重复

De novo组装及参考基因组中序列缺失

研究者对13个人群中的25个样本进行 linked-read测序,随后利用平均深度约50×的数据进行de novo组装。将这些组装与参考基因组GRCh38比较,共鉴定到1,643个断点可分辨的独特插入变异,这些插入变异共占1.9 Mb参考基因组缺失序列(图4A)。这些变异展现的群体结构显示,中非和大洋洲的分化程度最高(4B),反映了非洲内部的深度差异,以及大洋洲漂移、隔离和潜在的丹尼索瓦人基因渗入的影响。研究者发现大多数插入变异的片段相对较小,中位长度为513 bp(4C),尽管41%的基因插入只在1-2个样本中发现,但仍然观察到超过一半的样本中有290个基因插入,这表明参考基因组可能在这些位点存在罕见缺失等位基因。

wt_a52362020017223725_580976.jpg

4 参考基因组序列缺失的特异性插入变异
该研究对人类基因组多样性计划(HGDP)数据库中的结构变异进行了全面分析,为人类进化和精准医学研究提供了宝贵资源。然而,本研究中使用的短读长限制了复杂结构变异的发现,并且单一人类参考基因组限制了对多样性的准确表征和对人类结构变异的分析。因此,需要从不同人群中生成高质量参考基因组,并创建泛基因组,从而整合结构变异来充分发现和理解人类遗传变异。

参考文献:

Almarri MA, Bergström A, Prado-Martinez J, et al. Population Structure, Stratification, and Introgression of Human Structural Variation [published online ahead of print, 2020 Jun 11. Cell. 2020;S0092-8674(20)30619-X. 

来源:gh_ef83defd2d1d Nextomics

原文链接:http://mp.weixin.qq.com/s?__biz=MzA5MzI3NDczNQ==&mid=2650986780&idx=1&sn=13f6eb0b2b6c55d5b8efaaf05c4ea0e7&chksm=8b962e1cbce1a70af1f05b29736299bf896155c5437b839ad9f767987844c1ccefb2e7739d20&scene=27#wechat_redirect

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

基因组 cell 基因结构

推荐资讯