Science 文章:转录组测序揭示正常组织的体细胞克隆

科技工作者之家 2019-10-18

来源:Deep Omics

文章题目:RNA sequence analysis reveals macroscopic somatic clonal expansion across normal tissues

发表时间:2019年6月

期刊名称:Science

PMID号:31171663

关键词:正常组织、体细胞变异、RNA-seq

      本文对来自29种正常组织的6700多个样品转录组测序数据进行全面分析,发现了许多正常细胞里存在体细胞变异,而且阳光暴露的皮肤、食管和肺的突变负荷高于其他组织,这表明环境因素会促进体细胞变异。此外,研究团队还发现突变负荷与年龄及组织特异性细胞增殖率相关,这说明突变随着细胞分裂时间和次数累积。总而言之,本研究为正常组织里的克隆扩增提供一个广阔视角,为克隆扩增与环境因素、年龄和疾病风险的研究提供基础。

20191018120620_c5da58.jpg

背景介绍

       虽然肿瘤基因组研究已经发现了许多驱动肿瘤生长的体细胞变异,但是我们还不了解肿瘤发生阶段体细胞变异如何在正常组织里积累。为了解决这个问题,近期有一些研究对正常组织进行高深度测序,识别出大量体细胞变异,有一些发生在已知的癌基因上。这些发现凸显了研究发生在正常组织里的基因组事件的重要性。虽然有许多基于正常组织DNA的研究正在开展,但是样品数据有限。基于之前研究工作中积累的大量RNA测序数据,研究团队对正常组织的基因组变异事件和克隆特征进行了全面分析。

基于转录组测序数据的体细胞变异检测流程RNA-MuTect

       DNA上检测到的体细胞变异是否能在对应的RNA数据中发现,取决于突变的等位基因频率和测序覆盖度。本项目使用了来自GTEx的6700多个样品的RNA测序数据,涵盖了500多个个体,29种组织类型。研究团队开发了一种新方法 RNA-MuTect,基于组织样品RNA 及配对的正常组织DNA测序数据识别体细胞变异,灵敏度为0.7,精确度为0.91。

RNA-MuTect 主要步骤(图1):

1)对RNA bam (STAR 比对)和对照样品的DNA bam(BWA 比对) 用MuTect 进行体细胞变异检测,仅保留突变支持reads大于3的突变(比对到相同位置的read仅算一条);

2)用HISAT2对候选突变位点进行重比对,对用比对的bam再用MuTect 进行体细胞变异检测,仅保留两次变异检测都找到的突变;

3)用6500多例正常组织RNA-Seq数据得到的位置特异性错误模型过滤掉测序错误引入的变异;

4)去掉在ExAC数据库里最小等位基因频率大于5%的变异,非编码区变异,数据库收录的RNA 编辑位点,假基因和编码抗体基因上的变异。

最后,93%的RNA上检测到的体细胞变异被过滤掉。

20191018120621_d0298d.jpg

图1 RNA-MuTect 主要过滤步骤

正常组织里检测到的体细胞变异

      RNA水平检测变异需要携带该变异的克隆在RNA提取时占比足够,这样才能从由多种细胞构成的组织样品里检测到变异信号(如肌肉和脂肪细胞不增殖,会稀释变异信号)。故体细胞变异检测能力取决于 1)样品的克隆多样性;2)测序深度;3)突变基因的表达水平(图2A)。对6707个RNA-Seq样品, RNA-MuTect 共检测到8870个体细胞变异,其中阳光暴露的皮肤、食管和肺的突变负荷高于其他组织(图2B);RNA覆盖度与等位基因频率负相关(图2C),这是因为低等位基因频率的突变需要更高的覆盖度才能被检测到。考虑突变等位基因频率和有效基因覆盖后,作者发现突变数与表达水平负相关,肿瘤里也有类似发现,因为高表达基因的转录伴随修复更活跃。

20191018120621_d6a8ec.jpg

图2 正常组织里检测到的体细胞突变。A) 正常组织里提取的RNA组成示例;B) 28种正常组织里检测到的体细胞变异数;C)体细胞变异的等位基因频率分布。

体细胞变异随着年龄和组织特异性细胞增殖率增加

       年龄、DNA损伤积累和组织特性都能影响正常组织里的突变积累,且细胞增殖率越高,上述相关性越明显。年龄大于45的个体,CpG>T突变数(年龄相关突变特征)和总突变数显著增加(图3A),在10种细胞增殖率高的组织里,突变数与年龄的相关性更明显,而在10种细胞增殖率低的样品里没有观察到突变数与年龄的相关性,此外皮肤和食管组织里也发现突变数与年龄显著相关。突变数越多的个体MKI67 基因表达更高(该基因表达是评估细胞增殖率高低的指标,图3B)。对169个拥有大于10个突变的样品进行突变特征分析,在皮肤样品里发现一个UV 特征, 该特征在62/67的阳光暴露和1/5的非阳光暴露的皮肤样品里活跃(图3C)。突变数多于10个的皮肤样品都来自欧裔美国人,而非裔美国人的皮肤样品没有多于6个突变的,不管是否阳光暴露,这符合黑色素可以减少紫外线伤害的常识。

20191018120621_dc8083.jpg图3 突变负荷与年龄及组织特异性细胞增殖率相关。A)年龄是否大于45岁两组突变数差异;B)各个组织细胞增殖率指标MKI67表达与平均突变数相关性;C) 皮肤样品突变数与阳光暴露与否及遗传背景的关系。

正常组织里的癌基因突变及等位基因不平衡

       正常组织样品里,突变最高频的癌基因是TP53NOTCH1(图4A),且这两个基因的突变等位基因频率明显高于同样品里的其他突变,说明这两个基因的突变发生在早期,很有可能是由杂合性缺失引起。在癌基因上共检测到约1760个突变热点,其中14个突变热点在肿瘤组织中被报道过(图4B)。对正常组织里检测到的718个已知癌基因上的变异进行显著突变基因分析,找到16个显著突变基因(图4C),除了之前报道过的正常皮肤样品里显著突变的TP53,NOTCH1FAT1,还发现RAC1ZNF750显著突变,这两个基因分别在黑色素瘤和食管鳞癌中被报道过。

       研究人员还开发里一套基于RNA-seq数据鉴定染色体臂水平等位基因表达不平衡的方法,并在4个TCGA肿瘤样品进行测试,发现绝大部分RNA上检测到的染色体臂水平的等位基因不平衡在DNA上也有,反之亦然。研究人员在8个食管黏膜组织上检测到9q等位基因不平衡(图4D),其中两个还携带NOTCH1变异(NOTCH1落在9q),且突变等位基因频率很高(分别是0.22和0.12),这意味着要么9q的野生型拷贝发生丢失,要么突变拷贝发生扩增。有意思的是,9q丢失在食管非典型增生里比食管鳞癌里常见。现在研究人员在非增生组织里发现9q丢失,说明9q丢失是非典型增生发展的早期事件。

20191018120622_e4b053.jpg

图4 正常组织里的癌基因变异。A)热点突变基因;B) 热点突变在TCGA不同肿瘤里的出现次数; C) 正常组织里显著突变基因图谱;D) 正常食管样品9q染色体臂的等位基因不平衡。

我们的思考

虽然本文对正常组织里的体细胞变异进行充分研究,但是受限于RNA-seq对编码区覆盖度(仅有约55%的转录本有足够覆盖深度),我们还需要大规模基于各个正常组织的DNA测序来研究正常组织里的克隆进化。

环境因素对体细胞变异积累影响很大,对于反复由环境因素刺激而产生损伤的组织进行测序分析可以帮助认识环境因素如何促进肿瘤发生。

随着大规模人群队列测序的兴起,正常组织-癌前病变-癌长线追踪研究肿瘤发生变得更加可行。

如果希望用转录组数据充分反映肿瘤组织变异情况,需要对这块组织取多少次样品测序才能达到检测到的变异数饱和。

来源:gh_cc101106ed81 Deep Omics

原文链接:http://mp.weixin.qq.com/s?__biz=MzI2NDg2MjgyOA==&mid=2247483663&idx=1&sn=620ed687538a03573b02ca1607db7828&chksm=eaa76c0cddd0e51a686867dba034f621e054fd79abc7ad25a3f3e3a7829ff9993016fc10a881&scene=27#wechat_redirect

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

转录组测序

推荐资讯