Nature | 异常扩增的串联重复序列或能解释自闭症发病机制

科技工作者之家 2020-08-08

来源:BioArt

自闭症谱系障碍(Autism Spectrum Disorder, ASD)是一类以社交障碍,兴趣受限和刻板重复行为为特征的神经发育障碍性疾病。遗传因素被证实为ASD的病因之一,经典的双生子研究评估其遗传力(heritability)约为50-90%,家族性复发风险约为20%【1,2】。许多研究表明罹患ASD的个体产生“新发遗传变异”(de novo genetic variants)(即先证者中首次鉴定但在亲本基因组中不存在的变异)的比率增高:例如先证者“新发拷贝数变异”(de novo copy number variants, de novo CNVs)的发生频率是其未患病同胞的四倍,而“新发功能丧失性突变”(de novo loss-of-function mutations)的频率则是其两倍【3】。目前已知有100余种基因和基因座与ASD的患病风险增加相关【4】。然而,这些遗传因素总体上只能解释约20%的ASD病例【5】

基于与复杂疾病相关的单核苷酸多态性(single nucleotide polymorphisms,SNPs)的全基因组关联研究(genome-wide association stuides,GWAS)数据,“遗传力缺失(missing heritability)”这一问题被证实存在。而问题的关键在于GWAS主要集中于短核苷酸变异以及短核苷酸插入与缺失(indels)分析,真正致病的遗传变异来源往往被忽视,特别是串联重复多态性(tandem-repeat polymorphisms,  TRPs)。串联重复序列的扩张已经与40多种单基因疾病建立关联【6】,例如FMR1基因5’非翻译区的不稳定(CGG)n重复序列与脆性X综合征(fragile X syndrome,FXS)的智力发育延迟,脆性X相关性卵巢功能早衰以及与ASD相关【7】。然而它们与复杂疾病的关联及其本身的异质性在很大程度上都是未知的,并且可能作为“遗传力缺失”的重要来源。

2020年7月27日,加拿大安大略省多伦多市儿童医院的Ryan K. C. Yuen课题组在Nature上发表题为“Genome-wide detection of tandem DNA repeats that are expanded in autism”的文章。在文中,作者通过整合来自自闭症家系和对照人群的17231个基因组,分析其基序为2-20bp的串联重复序列的全基因组特征,从而确认串联重复序列的扩增与自闭症的遗传病因和复杂表型之间的强相关性。

wt_a12302200809042010_a56023.jpg

首先,研究人员收集来自MSSNG project,Simons Simplex Collection以及1000 Genomes Project的共20048个基因组样本,使用ExpansionHunter Denovo(EHdn)算法分别估算每个样本中串联重复序列的长度,经质量控制筛选出的最终数据集包含来自3636个ASD家族,1558个ASD单例和2504个对照人群的共17231个基因组样本。研究人员在31793个含串联重复序列区域中鉴定出37865种基序(motif),其中有2529个区域(8%)具有不止一种基序,最多在一个区域中存在多达92种不同的基序(chr2:32915989-32916586),且每个区域的基序数量以明显的非随机方式在整条染色体上差异分布。

wt_a12302200809042010_a87b12.jpg

图1:串联重复序列检测及分析工作流程示意图

随后,研究人员将含串联重复序列的区域与不同基因组特征相结合,以了解其分布规律。结果显示,这些序列普遍存在于富含GC的区域和所有已知的脆性位点区域,而在DNA保守片段中却几乎接近于无,且多位于相距转录起始位点(transcription start sites,TSS)1kb以上的上游区域和5’端非翻译区(图2)。已知脆性位点中串联重复序列识别度的提高可能会提供对基因组不稳定的易感性的相关信息,研究人员发现11个分子映射的罕见叶酸敏感的脆性位点中有9个(81.8%)与含串联重复序列的区域共定位,例如FRA12A / DIP2B,FRAXA / FMR1 和FRAXE / AFF2(前为脆性位点,后为含串联重复序列区域的基因),而13个分子未映射的脆性位点中有10个(76.9%)与至少一个由EHdn检测到的富含GC的串联重复序列包含区域重叠。

wt_a82302020080942010_ab466e.jpg

图2:串联重复序列的基因组分布特征

先前研究表明,诱发疾病且影响功能的串联重复序列扩增在一般人群中往往扩增程度明显且罕见。研究人员应用一种非参数方法来识别长度异常的串联重复序列,当存在于<0.1%的人群中时,将其进一步归类为罕见串联重复扩增(rare tandem repeat expansions)。在本研究中共有2588个罕见串联重复扩增被定义(共3339种基序)。随后,研究人员通过对来自SSC的欧洲血统个体进行负荷分析(Burden Analysis),评估本研究确认的罕见串联重复序列是否与ASD风险相关。结果显示,ASD患儿罕见串联重复扩张检出率为23.3%,未患病儿童则为20.7%,提示2.6%的ASD风险可能归因于这些罕见串联重复扩增。而这些异常扩增通常代表来自上一代亲本已存在的长串联重复序列的进一步扩增。

那么这些罕见串联重复扩增是如何增加ASD患病风险呢?研究人员发现与ASD相关的罕见串联重复序列扩增在外显子和剪接区中明显增加,且在转录起始位点或剪接点附近具有这一扩增的基因相对于其他基因而言更受抑制,这一分析结果表明罕见串联重复扩增可能对转录或剪接发挥调控作用。此外,他们通过通路富集测试以确认这些罕见串联重复扩增与已知ASD相关基因功能和生物学通路的相关性,主要累及神经系统发育,心血管系统和肌肉组织。

最后,研究人员建立10例ASD相关串联重复基因座的最优候选(表1),并通过另一种串联重复检测算法ExpansionHunter以及可视化读数匹配(visualizing read pile-ups),凝胶电泳和Sanger测序法证实其这些串联重复序列的扩增。此外,研究发现女性相较于男性而言,在富集基因集中罕见串联重复序列扩增的趋势更为明显,这可能进一步支持ASD中男性和女性的遗传负荷(genetic loading)差异。与先前关于罕见致病性SNVs和CNVs的发现一致,具有罕见串联重复扩增的受试者智商和Vineland适应性行为标准评分(Vineland Adaptive Behavioral standard scores)更低。这一分析结果为罕见串联重复序列扩增在ASD相关表型中的作用提供了有力的证据。

wt_a22322000809042011_b0432a.jpg

总之,这项研究代表了ASD遗传学领域的重大进步,鉴定出先前使用常规基因组分析方法未能识别的含串联重复序列扩增的许多基因,并提供其序列异质性,基因组分布,遗传风险,以及分子通路相关信息。当然,该研究也存在一定的局限性:1),尽管研究人员开发的方法可以灵敏且准确的获取串联重复序列扩增的相对总长度,但无法解释其接合性(zygosity)及方向问题;2),串联重复序列扩增的稀有性限制了确定其对外显率(penetrance)和其他表型参数的影响,需要扩大样本进行持续研究;3)由于现有算法的限制,无法对<150 bp的串联重复序列进行全面的全基因组扫描,有必要改进算法重复当前分析,以识别含小于此阈值的潜在致病性扩增的基因座。最后,此研究中建立的对串联重复序列扩增进行全基因组检测的策略,同时也为解决其他复杂疾病中“遗传力缺失”的问题提供参考。


来源:BioGossip BioArt

原文链接:https://mp.weixin.qq.com/s?__biz=MzA3MzQyNjY1MQ==&mid=2652495022&idx=1&sn=a316543068d8a365c68ee0cee09c15fe&chksm=84e24f1ab395c60c62a16f417af0614cb5b242d673f8143e94ed57ab33e33389945a0da5e8e9#rd

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

基因组 自闭症 序列

推荐资讯