责编丨兮
哺乳动物的基因组可以转录大量编码和非编码RNA,其中一些RNA可在细胞核内与染色质相互结合,以顺式或反式富集到转录位置或远端的基因组区域。鉴定染色质结合RNA的技术在近年得到飞速发展,这些RNA和相关的RNA结合蛋白(RBPs)在功能基因组调控中发挥了多种不同的作用,这些功能包括基因位点特异性激活或沉默,以及最新发现的参与染色质高级结构组织,例如参与增强子-启动子的远程相互作用、转录中枢功能、异染色质形成、各种核体形成和相分离等。
2019年6月3日,美国加州大学圣地亚哥分校付向东教授与李潇博士在Nature Reviews Genetics 杂志上发表综述文章Chromatin- associated RNAs as facilitators of functional genomic interactions,从RNA与染色质的结合机制、鉴定染色体结合RNA的策略、新生RNA的调控功能、重复区域来源的RNA介导基因沉默、RNA与核体形成、功能基因组中的RNA等六个方面做了详细总结和展望。
介绍
在哺乳动物基因组中有大约70%DNA可活跃转录为各类RNA,包括编码mRNA和非编码RNA(ncRNA),后者包括传统的tRNA、rRNA、snoRNA和snRNA,以及近些年发现的新类别,如miRNA,增强子相关RNA(eRNA)和长非编码RNA(lncRNA)。大多数ncRNA可与特定蛋白质相互作用,其中一些甚至形成相对稳定的核糖核蛋白颗粒(RNP)并承担重要功能,例如核糖体和剪接体。
虽然许多低丰度的转录本可能只是“转录噪音”,是转录复合物在开放的染色质区域广泛游动的结果,但新发现的各种RNA分子其特异和多样化功能越来越多,涉及不同细胞区室中各种结构形成以及基因调控作用,丰富了功能基因组学研究的内容。当然,大多数RNA不太可能单独起作用,而是与特定的RNA结合蛋白(RBP)相互作用。与基于蛋白质的相互作用一样,RNA具有特定的序列以及高级结构,使它们能够参与由核酸序列介导的或者基于大分子结构的相互作用。此外,RNA同时也具有与其他核酸通过碱基配对而相互作用的能力。
在本综述中,作者们首先介绍了RNA与染色质顺式和反式结合的模式。然后作者们将重点梳理检测染色质-RNA相互作用的最新技术进展,以及新发现的染色质结合RNA和RBP的功能,包括多种生物途径中的基因激活和抑制作用、几种类型的核体形成、以及在3D基因组中的潜在组织功能。尤其值得一提的发现是染色质结合RNA普遍形成“RNA云”,其范围常常覆盖活化的启动子簇及由染色质环化而带到启动子附近的远端增强子。此外,越来越多的由RNA介导的基因组相互作用被证明与多种液相分离过程有关,表明整个细胞核可被视为一系列有组织但高度动态的无膜凝聚体,作为承载功能基因组的结构基础。
一、RNA与染色质结合的不同机制
理论上RNA可以通过两种模式与染色质相结合,一种是新生RNA由于各种机理导致其滞留在转录位点,称为顺式相互作用;第二种模式是RNA合成后从其转录位点释放并与远端的基因组位点结合,即反式相互作用。这两种模式也可以在某些情况下组合起作用:如顺式作用RNA可以形成特定的RNP,然后募集其他的反式RNA或RNP。因此,一个基因组位点可以同时包含顺式和反式RNA,以实现多种调控机制。
1.1顺式作用RNA
将新生RNA保留在染色质上的最着名的顺式机制之一是通R-loop结构,即转录期间新生RNA与单链模版DNA形成双链RNA:DNA杂合体(图1a)。虽然目前在哺乳动物基因组中R-loop的形成位置仍未得到一致的认可,但领域共识是其富集于启动子和增强子的GC偏好序列,而且更重要的是R-loop的形成与生理条件下的转录活性密切相关。
将新生RNA保留在其转录位点上的另一种机制是通过扩增其他小RNA并靶向结合新生RNA(图1b)。扩增的RNA可以来自新生RNA的附近或远端的基因组位点。这种机制在端粒和旁中心粒异染色质的形成过程中尤为突出,例如裂殖酵母的核RNA干扰作用和通过黑腹果蝇的piRNA系统抑制反转录转座子。
结合在染色质上的最大一类的新生RNA是编码蛋白质的mRNA前体——pre-mRNA(图1c)。将新生RNA与染色质连接起来的关键机制是它们在转录过程中与RNA聚合酶的结合。尽管有部分mRNA前体在从染色质转录区域释放后被继续加工,但现已充分确定绝大多数mRNA前体加工成为成熟mRNA是这一过程是伴随转录共同发生的。经典的共转录加工步骤如5'加帽、mRNA前体剪接和多聚腺苷酸化等已被大量综述讨详细论过。最近几个研究表明,通过非典型剪接机制形成的环状circRNA则是另一种类型的顺式作用RNA。虽然大多数circRNAs从染色质释放后功能未知,少数circRNA则在他们的转录位置积累并与RNA聚合酶II(Pol II)结合,成为转录的正调控因子,但是这个新的调节模式的具体细节还很模糊。目前已经被人熟知共转录剪接模式的特点,这种机制确保了剪接时对于mRNA前体上剪接位点的顺序性识别,并且还允许各种剪接增强和抑制因子及时竞争以达到调控目的。某些RNA的加工过程,如miRNA加工和N6-腺苷酸甲基化(m6A)修饰,也一定程度上以共转录方式发生。在本综述中,我们更专注于与染色质结合的mRNA前体对转录的潜在影响。
1.2反式作用RNA
目前已知至少有两种RNA与染色质相互作用的反式模式,一种是通过形成三链体的核酸结构,即RNA与双链DNA(dsDNA)的大沟通过Hoogsteen碱基配对形成三链结构。这种类型的RNA-DNA相互作用对DNA中的多嘌呤序列和长度限制具有严格的要求(图1d)。因此,尽管三链体结构与R-loop都是RNA:DNA杂交体,但其存在本质区别。多个lncRNA利用通过序列互补的特异性,利用三链体机制停靠在特定的基因组位置上发挥其调节功能,实现这种适合于核酸大分子的独特策略。
最常见的反式结合模式是通过蛋白质介导的RNA相互作用,其中RNA充当结合RBP的支架,并且形成的RNP内有至少一个组分与DNA结合蛋白直接相互作用(图1e)。这种机制的一个典型例子是SAF-A/hnRNP U在lncRNA Firre反式定位中的作用。有趣的是,除了具有可识别的RNA结合基序的RBP之外,在哺乳动物细胞中也存在大量非典型RBP。这些RBP是在分析UV交联的mRNA、ncRNA或新生RNA蛋白质中大量发现的,这些方法利用RNA和蛋白质可以用生化方法被分离至水相和有机相的特点,RNA-蛋白可被有效地被层析回收并用于质谱分析。重要的是,典型和非典型的RBP均倾向于形成复合物起作用,因此也可以从蛋白质-蛋白质相互作用组中推断出。许多DNA结合蛋白也可能具有结合RNA的能力,例如hnRNP K,其最初是作为调节MYC基因表达的转录因子被发现的。另外,在线粒体发生过程中有关键作用的PGC1a是典型的转录因子,但其包含一个典型的RNA结合基序。迄今为止,已发现多种经典转录因子和表观基因组调节因子具有直接结合RNA的能力,包括EZH2和SUZ12(均为PRC2的关键组分)、YY1、NELF和DSIF、CTCF、DNA甲基转移酶,以及最近发现的SUV39。因此,通过与多种典型和非典型RBP直接相互作用,可以有效将RNA反式募集到特定基因组位置。
1. 不同的RNA-染色质互作模型
1.3顺式和反式组合作用的RNA
RNA与染色质的顺式或反式相互作用不一定是互斥的,相反,两种模式可以组合起作用,如之前提到的在建立异染色质时新生RNA与扩增的小RNA相互作用。利用组合作用模式的RNA最好的例子是非编码RNA Xist,其主要功能为在哺乳动物中建立X染色体补偿机制。Xist与无活性X染色体(Xi)相互作用最有特色的方面,是其顺式作用由Xist基因位点的几种ncRNA的表达而引发,随后在整个Xi上扩散染色质抑制性标记H3K27me3。由于在细胞核基质里人为消除SAF-A后可以导致Xist不积累在Xi,所以这种标记扩散极有可能涉及Xist的反式作用。此异染色质的标记是由PRC2介导的,并且整个沉默状态的扩散需要PRC1和PRC2之间的合作互动。然而,关键的RNA元件和PRC1和PRC2的作用顺序一直是领域内未决的争议。即使如此,Xist介导的表观遗传调控一直是研究哺乳动物细胞中RNA染色质相互作用的经典模型。
二.鉴定染色质结合RNA的策略
染色质结合RNA可以通过将染色质分离并进行深度测序。在标准的细胞组分分离过程中,通常可以分离细胞核并使用沉降的方法进一步分离核内颗粒和核质组分。这种核内颗粒通常被认为是染色质部分,因此用于提取RNA并测序。然而,对于这类结果必须谨慎对待,因为分离的颗粒部分不仅包括染色质,还包括更广泛的“核基质”,因此,标准核分离方案不能完全区分染色质结合RNA与附着在核基质上的RNA。目前几种实验方法已被开发用于鉴定真正的染色质结合RNA以及其结合位点,这些方法可以大致分为“一对多”与“全对全”策略。
2.1一对多策略
“一对多”策略通常使用特定的合成RNA或DNA分子探针来捕获单一种类的染色质结合RNA,随后深度测序的方法鉴定其结合的染色质和具体基因组位点(图2A),代表性方法有ChIRP、CHART和RAP。所有三种方法都使用有生物素标记的探针与特定的靶标RNA杂交,从而捕获含有RNA的染色质。为了确保特异性,可以将多个探针分成两个独立的池(所谓的奇数和偶数探针池);用来鉴定共同靶标。然而,该方法并无有效处理非特异背景信号的办法,因为某些RNA或含RNA的颗粒可能以非特异性方式粘附于珠子或探针。解决这个问题的一种方法是设计一系列探针并使用RNase H来测试哪些探针可以被其预期的RNA靶标捕获,这样可以将探针分为特异组和非特异组并行用于实验,特异组的信号可以被视为前景信号,而那些非特异组捕获的染色质可以作为背景信号。RAP程序通过使用较长的生物素标记的RNA捕获探针来部分增强特异性。另外,可以利用敲除靶标RNA后的背景信号用于校正,这对所有基于探针捕获的方法都有帮助。
所有基于探针捕获的方法都有一个固有的局限性,因为这些方法一次只能研究一种特定的RNA。但优点是只要通过实验和计算方法有效地控制信号特异性,它们就能够用于研究无论细胞中丰度如何的染色质结合RNA。这种基于探针捕获的方法的另一个主要优点是能够与多种其他策略结合,在一次实验中鉴定所有潜在的大分子相互作用,如dChIRP,通过质谱法研究特异性RNA结合蛋白;以及通过补骨脂素(psoralen)或紫外线交联鉴定RNA-RNA相互作用,例如RAP-RNA和hiCLIP方法。原则上,RNA捕获也可以与Hi-C偶联用以检测由RNA连接的DNA-DNA相互作用。
2.2全局策略
最近,三个实验室研发了类似的技术来检测全局RNA染色质相互作用。所有这些方法都基于使用一种双价接头,其能够在一端与RNA连接,而另一端与限制性内切酶消化的DNA连接。这些方法适用于固定后分离的细胞核(图2b)。其中一个技术是MARGI,其使用双价接头连接RNA和DNA,然后进行环化以构建文库共测序。另外两个独立开发的技术,GRID-seq和ChAR-seq几乎相同,但有一个区别:GRID-seq使用的双价接头带有两个限制性位点,用于IIS型限制酶(MmeI)消化文库,产生固定长度的最终连接产物;而ChAR-seq在添加用于文库构建的衔接子之前,将连接的产物超声处理以获得较小的片段。基于限制酶切的GRID-seq方法确保数据中所有读段都包含RNA和DNA序列,而MARGI或ChAR-seq都是无法确保这点的,但GRID-seq牺牲的是其比对短片段的能力,而MARGI和ChAR-seq则需要更多测序通量以获得足够数量的配对RNA和DNA序列。需要强调的是,所有这些策略都是基于RNA与附近DNA的在物理距离上的靠近,因此它们不一定仅捕获直接的RNA-染色质相互作用。
虽然所有这些全局策略都可供研究者使用和进一步改进,但最重要的需求是确保信号特异性。在进一步的生物信息学分析之前,评估文库质量的第一步是证明捕获RNA和DNA链的特异性,因为来自RNA侧的序列本应来自被转录的编码链而不会是来自模版链,而来自DNA侧的序列则没有链特异性。第二个重要的特异性问题是区分特异性和非特异性RNA-染色质相互作用。可以想象,特定的RNA可以与单个或多个特定的基因组区域相互作用(通过顺式或反式模式),而相同的RNA一旦从其合成位点释放,也可以在细胞核中传播,从而粘附到所有可接近的染色质区域,形成非特异的RNA-染色质相互作用背景信号。GRID-seq通过使用物种间RNA交换结合的方法解决这个问题,例如在构建文库过程中混合人和果蝇细胞核,使得人类RNA非特异结合到果蝇DNA,反之亦然,这些信号清楚地指明了相互作用的非特异背景。该背景与基于均一化的全部反式mRNA信号(即所有结合到转录位置所在染色体以外染色体的mRNA)几乎相同,因此可以直接使用数据内的反式结合mRNA的集合作为背景信号,从而计算出特异的RNA-染色质相互作用。ChAR-seq在文库构建过程中使用加标准RNA进行非特异性信号的控制,从而提供非特异性RNA-染色质相互作用强度的估计。然而,与GRID-seq不同的是,应用MARGI或ChAR-seq发表的工作没有开发出上述的“零模型”来推断个别基因组位点的特异性相互作用。
可以想象还有很多种思路可以被其他更多策略采用,在特定基因组位点鉴定全局或局部的RNA-染色质相互作用。例如,最近被研发的SPRITE技术,采用反复分合的条码识别策略来检测核部分的DNA-DNA相互作用,而不是像Hi-C那样依赖固定在核内的邻近连接。原则上SPRITE也可用于检测全局RNA-RNA和RNA-DNA相互作用(图2c)。
所有这些方法的共同弱点是灵敏度低,因此许多低丰度的染色质结合RNA可能无法检测到。克服这个问题的方法之一是靶向富集基因组位点本身而不是富集RNA,这样可以弥补某一特定基因组位置信号的丰度问题。该方法可以用于鉴定在特定基因组位点的RNA-蛋白质,DNA-蛋白质和RNA-DNA相互作用。基于荧光原位杂交(FISH)的一个策略也已被开发,可以用于捕获特定的多组学分析数据。最近也有研究报道了使用guide RNA与生物素修饰的dCas9结合来检测特定基因组位点相互作用的策略(图2d)。综上,不同的技术可以被组合来解决特定的生物学问题,也许还有许多用于鉴定RNA-染色质相互作用的新发明方法很快就会问世。
图2. 分析RNA-染色质互作的不同策略
三、新生RNA的基因调控功能
顺式和反式作用的染色质结合RNA都具有在基因表达的调节功能。这种调节可以是依赖于特定RNA或特定基因组位点的方式激活或沉默基因表达。这些调节功能的最终结果是活跃转录的基因组区域保持常染色质状态,而那些沉默的基因组区域最终成为异染色质。有趣的是,有证据表明这些过程可能涉及各种RNA介导的反馈和前馈机制。下面讨论不同类型的检测染色质结合RNA的调节功能及其生物学意义。
3.1 3D基因组中转录中枢的概念
越来越多的证据表明,新生RNA不仅仅是产物,还可能作为转录的调节因子起作用。一类这样的新生RNA包括启动子上游转录物(PROMPT)和增强子相关RNA(eRNA),这两者都被加帽,但并没有多腺苷酸化。有趣的是,GRID-seq无法有效捕获这些RNA,这可能是由于它们参与R-loop形成,并且其丰度相对较低,导致与接头的连接受到阻碍。PROMPT诱发的R-loop可增强的特异性转录因子和染色质重塑蛋白的募集。eRNAs的生产则显然是与增强子的活动密切相关,但eRNAs如何帮助保持转录激活状态是一个正在研究的热门问题。最近的一项研究表明,eRNA能够直接结合一些关键的转录共激活因子,如CBP/p300,这可能是依赖RNA来提高增强子活性的一个前馈机制。各种证据表明,eRNAs可促进增强子特异性的环化至目标启动子来增强转录,但这一理论尚未成为该领域的共识,因为其他研究阻断eRNA的产生后未能检测到染色质环化出现显着变化。有趣的是,某些目标启动子的缺失也会减少相对应的eRNA的表达。因此,启动子与增强子相互作用的3D空间距离和转录活性可能是相互促进的,从而为转录因子的循环再利用创造了一个局部环境。然而,3D基因组相互作用和转录激活现象的因果关系仍然不甚明了。
最近出现了一个令人费解的基因组学研究结果,如果将某个增强子在DNA水平失活,并不总是能够检测到其邻近基因转录功能性改变。这可能是由于针对一个启动子的多个增强子产生冗余功能,或者有“影增强子”的作用。一般而言,针对一个被激活的启动子,我们尚无法得知哪些增强子彼此冗余,以及多少增强子可以一起协同工作。有意思的是,在GRID-seq数据的分析结果中,新生的mRNA前体不仅保留在它们的转录位点上,而且还选择性地与空间接近的远端基因组元件(包括增强子)相互作用,就好像新生的转录本形成独立的“RNA云”,覆盖DNA上的调控元件(图3a,b)。这一观察结果,加上由ChIA-PET检测到有Pol II结合的DNA-DNA相互作用,引入了在3D空间中由新生RNA覆盖的“转录中枢”这一概念。平均而言,每个中枢包含~4个活化启动子,1个或2个超级增强子,最多约20个的典型的增强子。基于超级增强子的关键转录共激活因子研究,以及转录因子和Pol II高分辨率成像分析结果也总结出过类似的转录中枢概念,协同染色质结合RNA的结果,所有证据都提供了一个可能性,来解释当一个增强子失活时观察不到转录的功能性变化。可以想象,因为在转录中枢中缺失一个增强子可能不足以对转录产生不利影响。基于这个概念,也不难想象,移除一个增强子或启动子可能导致转录中枢发生重组,从而引起中枢中的启动子和增强子的在一定程度上的重新分配,这一理论也已被近期的实验证明。由于转录中枢的这种调节机制,一个基因可能在其激活或抑制期间被现有中枢关联或从中排除。
图3. 新生转录本与RNA云
另外一个悬而未决的关键问题是,给定的中枢内RNA是否仅仅反映其与附近DNA元件的瞬时被动相互作用,还是实际上对创建或维持这样的基因簇协调转录具有主动组织作用。目前,有实验证据表明多种lncRNA对周边基因的表达具有顺式调节作用。一个经典的例子是黑腹果蝇的lncRNA roX2,其功能主要涉及性染色体补偿。在有roX2结合的X染色体上,roX2似乎覆盖了绝大部分的DNA-DNA相互作用。但是,这一组织基因组相互作用的功能是否只适用于特定的lncRNAs,还是适用于一般的转录中枢的新生RNA,这一问题仍然未知。和这个问题相关的一个问题是,eRNA是否是介导特异性启动子-增强子相互作用中必须的,或实际上参与中枢内的广泛相互作用?鉴于特定的增强子缺失不一定会破坏转录中枢,也因此不一定导致转录的功能性变化,阻断特定eRNA后不一定能检测出的功能性变化。因此,转录中枢这一概念有助于解释文献中关于eRNA的转录控制功能中各种相互矛盾的结论。此外,虽然单个转录中枢似乎主要与中枢内基因转录产生的新生RNA相关,但许多lncRNA也被认为对转录中枢以反式模式作用,从而影响其他基因的转录。本领域未来研究中要解决的另一个有趣的问题,是由数据推断出的转录中枢是否与之前提出的细胞核“转录工厂”这一概念相对应。转录工厂概念的一个特点是允许转录因子在局部循环,这一特点已在果蝇研究中由诱导的热休克蛋白基因所证明。
3.2新生RNA作用于动态控制基因表达
当一个新生的mRNA前体首先从Pol II中出现时,距离启动子区最近的部分可能形成一个R-loop。近期研究表明这一过程有助于诱发转录停滞。相反,R-loop形成还可以为转录激活因子(例如Tip60和p400)的募集产生有利的微环境,从而促进转录暂停释放(图4a)。某些mRNA前体的5'末端还携带特定的序列,其不仅可以增强共转录剪接,还可以促进转录暂停释放(图4b)。这一特点在在SRSF2(属于剪接因子SR家族)已被研究证实,当高亲和力SRSF2结合位点从Pol II中新转录出来时,本来位于启动子相结合的7SK复合物的SRSF2会易位到新生RNA。重要的是,从7SKncRNA到新生RNA的这种易位伴随着来自7SK复合物中pTEFb酶的释放,以催化多种磷酸化事件,包括在Pol II的C末端结构域(CTD)上的Ser2位置的磷酸化,以及转录延伸因子DISF和NELF的磷酸化,最终导致转录暂停释放。有趣的是,这一系列事件首先用HIV的Tat蛋白阐明。由于Tat和SRSF2都含有相关的富含精氨酸的序列,两种蛋白质似乎都使用类似的机制激活转录。最新的证据发现破坏SRSF2功能的突变可导致血液祖细胞疾病-骨髓增生异常综合征(MDS),表明该调控过程的确具有生理意义。
与通过RBP结合新生RNA中的独特序列来激活转录这一机制相比,PRC2这一负责在兼性异染色质上标记H3K27me3的复合物则以高度弥散的方式与新转录的RNA相互作用。尽管具有如此广泛的RNA结合谱,PRC2结合RNA显然仍具有一定程度的特异性,例如最近阐明的富含GC的序列。值得注意的是,基于一些体外研究,不管使用单独的纯化亚基或使用预装配的复合物,PRC2的多个亚基都体现出直接接触RNA的能力。重要的是,PRC2和mRNA前体之间的这种相互作用提供一个了控制转录的动态机制,但事实上确有两个看似相互竞争的模型来阐释其机制(图4c)。一种模型描述了PRC2结合DNA和RNA的互斥性,这有助于解释为什么PRC2不会影响许多高度转录的活性基因,因为这些基因可能通过使用新生RNA来预防其结合高度活跃的转录状态的染色质(图4c,左)。
然而有趣的是,哺乳动物基因组中也充斥着大量的所谓二价的启动子,其同时具有H3K4me3(标记激活基因)和H3K27me3(标记用于沉默基因)。这些二价的启动子可以动态地调节胚胎干细胞从初始状态(naive)过渡到活化状态(primed),但如何在给定细胞类型的基因启动子保持这种二价状态是一个未解决的问题。在Xist建立异染色质的机制中,新生RNA可以指导和促进PRC2的初始招募,以及招募其他Xist结合蛋白如SHARP和SPEN,协同作用于PRC2以提高异染色质扩散和转录沉默。类似的机制也适用于一般的带有二价启动子的基因(图4c,右),比如在PRC2和新生RNA结合后发生转录暂停时,RNA结合蛋白RBFox2与PRC2广泛协同作用,在新生RNA介导下给正在转录的染色质加上H3K27me3修饰。重要的是,最近的研究表明RNA,虽然和染色质竞争结合PRC2,并不会抑制组蛋白甲基转移酶的活动。因此,在新生RNA介导的下招募PRC2之后,任何可以在附近二价的启动子区域稳定PRC2的机制,都有助于维持启动子的二价性以限制其转录产物输出,例如,二价的启动子区域已有的H3K27me3就可以通过结合PRC2的EED亚基来将PRC2在此区域锚定。因此,该机制代表了一个依赖于新生RNA的基因表达反馈调控。同样重要的是要知道各种PRC2组分可独立与染色质互动,比如EZH2和SUZ12,表明PRC2通过与细胞中不同的蛋白质结合协作,可能对不同的基因起不同作用,这也同样协调了两个相互竞争的模型的共存。
图4. 染色体相关的新生RNA参与转录激活与抑制
四、重复区域来源的RNA介导基因沉默
与兼性异染色质相比,组成型异染色质更稳定,它特征是具有H3K9me2/3修饰,多位于常染色体的反转录转座子、端粒、着丝粒和旁中心粒区域。基于裂殖酵母和黑腹果蝇的这方面研究已被大量综述所讨论,使我们目前对组成型异染色质生成有一定的了解。通常,该过程分三个阶段进行:首先,含有重复序列的DNA被转录;第二,将H3K9me2/3异染色质标记扩散到相邻基因组位置;第三,细胞分裂后这种沉默状态的遗传。这种表观遗传控制机制中有一个有意思的条件,即转录活动是转录被沉默的必要前提。
在裂殖酵母中,重复序列首先启动转录,转录本通过RNA依赖性RNA聚合酶(RdRP)扩增;然后扩增出的双链RNA(dsRNA)被Dicer酶处理成小的干扰RNA(siRNA);小干扰RNA加载到Ago1内后,这些小RNA作为指引靶向到新生RNA从而诱导转录沉默。启动和后续扩增步骤都由两个正向前馈环路强制执行(图5a)。第一个前馈环路是由RNA介导的,涉及RNA诱导的转录沉默复合物(RITS)与染色质结合的重复转录本之间的相互作用,其中RITS可以募集特定的H3K9m2/3甲基转移酶(裂殖酵母中的Glr4,人类中的SUV39H1和H2),形成大型复合体。一旦标记了一些初始的H3K9me2/3修饰,信号接下来被第二个非RNA介导的前馈环路放大,因为甲基转移酶本身能够结合H3K9me,并且这些修饰也被其他的H3K9me结合蛋白所识别(如裂殖酵母中的Swi6,人体中的HP1)。这个过程被多个蛋白质-蛋白质相互作用巩固加强,从而促进H3K9me2/3以序列-环境依赖的方式扩散到相邻基因组位置。有趣的是,最近的一项研究表明,SUV39H1和H2作为甲基转移酶,含有一种染色质结构域(chromodomain)也能够直接结合RNA。Chromodomain长期以来就被认为是与RNA结合的蛋白结构,但并没有太多的特异性。另外,SUV39H2携带额外的碱性氨基末端序列,最近的研究也已显示其与RNA直接结合。这些发现解释了甲基转移酶如何与异染色质的RNA依赖性结合,作为第一和第二前馈环之间的另一层分子联系。
与这些被精细阐述清楚的途径相对的是其普遍适用性。困惑在于黑腹果蝇和哺乳动物基因组不编码RdRP蛋白。在果蝇中,一个类似的RNAi途径可能是其替代(图5b)。最初,原始piRNA由逆转录转座子产生,其被加载到Piwi复合物上并借助多种Piwi复合物组分(包括Asterix和Panoramix)靶向到逆转录转座子产生的转录本。为了在局部和其他基因组位置上充分建立沉默状态,重复序列产生的RNA由“乒乓机制”顺序化处理。与裂殖酵母一样,扩散阶段涉及Piwi,SUV39,HP1和其他几个因子的相互作用网络。然而,尽管piRNA系统提供了一种机制,可以扩增转座子衍生的小RNA,从而使果蝇和哺乳动物的反转录转座子沉默,目前尚不清楚这种piRNA介导途径是否也是在着丝粒和旁中心粒区域建立组成型异染色质的机制。由于piRNA途径主要在果蝇和哺乳动物的生殖细胞中起作用,因此一旦建立,就有可能在整个发育过程中维持异染色质状态。也有可能存在某些增强机制,与哺乳动物体细胞中卫星重复序列的功能是一致的。在这方面值得注意的是,实验证明内含子靶向siRNA可以诱导的H3K9m2/3,并且通过减少转录延伸来调节可变剪接。另外,在染色质上检测到多种Argonaute蛋白,包括Ago1和Ago2。这些研究结果表明,虽然piRNA系统致力于沉默生殖细胞中的反转录转座子,但siRNA途径可能负责体细胞中着丝粒和旁中心粒区域中组成型异染色质的形成以及维持。
图5. 异染色质建立的RNA依赖和非依赖反馈环路
异染色质在细胞分裂后甚至可以通过多代生物进行遗传。例如在秀丽隐杆线虫中,这个过程似乎涉及多种蛋白质来组成不同类型的细胞质颗粒。由此引发的问题是组成型异染色质的维持和遗传是否不仅需要局部扩增的RNA,而且还需要反式作用的重复序列衍生RNA,因为组成型异染色质仍然可以被检测到一定程度的恢复。裂殖酵母最近的一项研究表明,反式作用的siRNAs确实可以在常染色质区域的内源等位基因上诱导异染色质形成。因此,似乎初始的RNA依赖性诱导后,异染色质形成可能需要额外的RNA来维持沉默的染色质状态。因此,这一复杂的途径可以与其他RNA加工步骤相关联,如mRNA前体剪接、转运和RNA衰变中涉及的各种因子的作用,以达到异染色质的遗传目的。例如,RNA输出因子NXF1的一种可变剪接体在维持小鼠IAP反转录转座子的沉默中起作用,并因此限制转座活性。RNA代谢调控与基因表观遗传调控之间的功能性相互作用还有许多方面尚待探索。
五、RNA与核体形成
各种无膜亚细胞结构域相关的液相分离过程是近年来一个新出现的概念。值得注意的是,迄今为止绝大多数该方向的实验证据都涉及RNA。由于RBP是包含所谓的低复杂性结构域(LCDs)的主要蛋白质类型,其本质上是无序的并且在体外具有形成流动液滴的趋势。现已证明RNA可以驱动各种相变过程,从而有助于3D基因组的动态组织(图6a)。在这里,我们讨论染色质结合RNA在这方面的功能。
5.1核仁:核体形成的范例
核仁是核糖体生物发生的高度专业化的一种核体,其形成过程已成为其他核体形成的概念框架,例如Cajal体和核斑。核仁围绕分布在哺乳动物细胞中的位于五个不同染色体上的rDNA簇,其中rRNA的转录与rRNA加工和核糖体组装相结合。这种协同活动被细分为核仁中内至少三个不同的细胞学区域(图6b):用于rRNA转录的纤维状中心(FC),用于rRNA加工的致密纤维区(DFC),和用于rRNA修饰和核糖体组装的颗粒区(GC)。这些区室中的每一个都与一组独特的蛋白质相关联,例如位于FC的Pol I,位于DFC的fibrillarin(FIB1)和位于GC的核质蛋白(NPM1)。值得注意的是,最近的一项研究表明这些区室都具有液滴的特性,可以进行高度动态的同型融合以及不同区室之间的聚结,另外干扰核肌动蛋白网络后将导致所有三个区室坍塌并聚结成单个液滴。
虽然这项精彩的研究表明了FIB1和NPM1各自能够用它们的LCD形成单独的液滴,但未解释的问题是连接这些液滴以及保持不同液滴相互分离的机制是什么?以高度有序的方式发生的rRNA共转录加工和核糖体组装可能负责将这些区室锚定到rRNA转录的位点,并将所有三个区室连接在一起。有趣的是,最近的一项研究表明RNA解旋酶DDX21在多个Pol I复合物周围形成环状结构,并且被含有snoRNA的lncRNA SLEAT调节参与调控rRNA转录。因此,DDX21环可能有助于防止FC与DFC和GC融合。最近发现另一种lncRNA LoNA通过其5'序列与RBP核仁蛋白(NCL)结合以调节rRNA转录,并通过其3'序列与FIB1结合以调节rRNA修饰。因此,LoNA可以帮助将FC桥接到DFC和GC。基于这些最近的发现,可以想象虽然区室特异性蛋白质形成单独的液滴,但不同的RNA和RBP可以帮助保持它们的连接以及防止它们聚结,这表明RNP可能在这一系列过程中起核心作用,通过调节液相分离来协调核中的核糖体生物发生。
5.2 Cajal体:层状RNP液滴?
Cajal体(CB)是与用于mRNA前体剪接的多种snRNA的生物发生和再循环相关的核结构,另外,一些组蛋白基因也与这个核体相关。多项研究表明,CB的形成和动态调控遵循和核仁几乎相同的原则(图6c)。首先,人为引入复制依赖性的组蛋白基因H2B过表达,或者U2snRNA过表达就足以自发形成CB。最近使用染色体构象捕获方法4C-seq的研究还表明,多个U型snRNA基因以及CB相关组蛋白基因聚集在CB周围,这不仅涉及染色体内相互作用,还涉及染色体间相互作用。因此,这种起始机制类似于由不同染色体的rDNA表达从而形成核仁组装。其次,来自CB的snRNP成熟需要SMN复合物和相关Germin蛋白。有趣的是,这些蛋白虽然显示出彼此的密切关联,但并不与Coilin(CB的骨架蛋白)直接重叠。CB的完整性还取决于核肌动蛋白,并且活细胞成像证据表明CB在细胞周期期间会有不断的裂变和融合现象。这些观察结果让人很容易联想到核仁中不同的区室,这表明单个Germin装饰的CB可能对应于由新生snRNA所连接的独立液滴,以及在共转录加工和组装过程中高度复杂的蛋白质-蛋白质相互作用网络。值得注意的是,细胞质内的P体和应力颗粒似乎也同样对应了细胞核内CB的多种由多价RNA-蛋白的相互作用介导的特征,特别是最近发现的对于线虫RNAi跨代遗传至关重要的空间堆叠性胞内颗粒。
5.3核斑和核旁斑:基因簇的储存地还是组织者?
核斑(Nuclear Speckle)是大多数剪接因子聚集的哺乳动物细胞核亚结构的类型之一(图6d)。核斑与大部分细胞中最丰富的lncRNA之一MALAT1共定位,但MALAT1似乎并非核斑组装或维持所必需。在剪接领域中许多人认为核斑是剪接因子的储存位点,因为如果人为诱导表达一个mRNA前体后可以观察到剪接因子从核斑到诱导表达位点的募集行为。然而,通过RNA捕获,发现MALAT1与活跃转录基因的启动子结合,这一观察最近再次被SPRITE技术所证实,揭示了核斑周围广泛的染色体间相互作用。因此,看起来虽然核斑的核心主要是由准备回收的剪接复合物组成,但是在各个核斑周围组织组织了高转录活性的基因群,正像染色质附着的RNP被表面张力主导而聚集到附近的核斑一样,这一猜想也被最近的一个应用dCas9的光遗传学技术所证实。广谱的转录抑制也会使核斑聚集融合,但这一过程在恢复转录后也是可逆的,表明新生RNA具有将染色质连接至核斑的作用。
有趣的是,最近的研究揭示了从转录、共转录到转录后RNA加工的一系列相变事件,这可能成为染色质与核斑空间关系的基础。例如最近提出的参与转录激活的增强子(尤其是超增强子)可以经历连续的相变,这一相变过程涉及含有LCD的转录共激活因子,例如MED1和BRD4以及Pol II本身。具有RNA结合能力的剪接因子和其调节因子是一大类含有LCD的蛋白质。例如,已发现剪接调节因子RBFox2是大型剪接调控复合物的一部分,其组装取决于其LCD中的关键酪氨酸残基,多个hnRNP剪接调节因子也显示出形成液滴的倾向,这一特性对于它们的剪接调节功能是很重要的。因此这一过程可以被想象为从转录位点到核斑核心的一系列液相分离过程。
核旁斑(paraspeckle)代表了另一种有趣的液-液相变的范式。此核内亚结构因为总是位于邻近核斑而得名(图6d),但不像核斑,其含有的lncRNA NEAT1已被证明是这个哺乳动物细胞核亚结构维持所必须的元件。核旁斑内含有>30个RBP,其中许多是已知会发生相分离的蛋白,例如核旁斑相关RBM14和FUS/TLS。目前还不清楚为什么核旁斑总是在核斑旁边,但最近的一项研究显示NEAT1使大量的RBP聚合,这些RBP可以结合几乎所有miRNA(pri-miRNA)以及处理这些miRNA的加工复合物。因为约80%的pri-miRNA存在于各种mRNA前体的内含子,这些前体可能在核斑处或附近被加工,这一关联强烈指示了初级(去除内含子)和次级(pri-miRNA加工)RNA加工步骤之间的协同相互作用。同时也预示核斑与核旁斑的空间关系本质上是被新生的mRNA前体所连接的多个独立液滴。
图6. 相分离与核体形成中的RNAs
5.4异染色质也形成液滴
与新生的RNA介导形成核体相比,最近的研究表明HP1是异染色质的主要成分,并能够在体外和体内形成液滴,HP1的这种功能特性可能解释了不同端粒之间的相互作用。由于这些端粒主要是由组成型异染色质构成,就像是每个端粒末端都形成独立的液滴,同时某些端粒液滴可融合来连接不同的染色体。如上所述,异染色质也由染色质相关的重复序列衍生的RNA凝聚,因此暗示着RNP可能参与组织和调节富含HP1液滴的动态融合和裂变,尤其是当重复序列衍生的RNA进行反式作用来帮助异染色质的维持和遗传过程。因此,这一调节原理与同时涉及新生染色质结合RNA以及其他反式作用RNA的核体形成过程相似(如CB中的snRNA和组蛋白mRNA以及核斑与核旁斑中的部分加工的mRNA前体)。这些主要核体由RNA凝聚而形成的原理也可适用于其它类型的细胞内亚结构形成,如在细胞核中的PML和SAM68小体,以及位于细胞质中主要用于生成piRNA的Yb体。
六、功能基因组中的RNA
尽管在过去的十年中基因组结构有了深入研究,一个针对基因组内各种相互作用和基因组空间结构组织的根本性的问题仍然存在,即它们和基因表达的因果关系。该问题也与RNA相关,因为RNA可能在转录中具有调节功能而不仅是简单的转录产物。对染色质结合RNA的分析表明,这些RNA无论是顺式产生还是反式招募,都可以通过增强子,尤其是超级增强子,来提供基因激活的多种模式。因为与超级增强子结合的新生RNA是GRID-seq技术揭示的染色质结合RNA的主要类别,这种新生的RNA凝聚转录中枢可能有助于建立染色体区域。因为活性基因倾向于在染色体区域的外围,同时核体(尤其是核斑)早已被发现能够填补在染色体区域之间的空间。如此,协调转录和共转录RNA加工过程可以提供驱动染色体内和染色体间的相互作用。
现在已知许多RBP具有固有的无序区域可用于驱动液滴形成,并且可以介导液相分离。最近的研究表明,甚至某些RNA(如PolyQ编码三联体重复序列)也含有特定的二级结构,有助于促进相分离。重要的是,RNAs不仅促进液-液相变,而且还防止液滴坍塌。在某些情况下,它们还抑制特定RBP病理性的聚集,对神经退行性疾病的发生过程具有重大意义。因此,核RNA及其与特定RBP的相互作用可被视为基因组不同部分的联系。
至少有两种驱动力保持不同的RNP液滴分离。一种是通过将异染色质区域附着到核包膜,另一种可能与定义不甚明确并具有争议的核基质有关。暂时定义的核基质的主要组成部分之一是SAF-A/hnRNPU,并且一些研究强调了其在建立调节基因表达的核结构中的作用。SAF-A的人为去除可防止含有Xist的复合物靶向到将要失活的X染色体,同时也伴随着Cajal体的增多,以及长距离DNA-DNA相互作用的弱化。最近的一项研究进一步揭示了SAF-A/hnRNP U的ATP酶活性调节其与染色质结合RNA的相互作用,并且该核基质蛋白的寡聚化可以驱动染色质解体。因此,核基质提供了一个用于对接不同核区室的网状结构,用于核区室的组分进行主动交换。
结论和展望
目前对于细胞核中功能基因组组织的研究主要是从DNA-DNA相互作用的角度开展。在本综述中,作者们关注染色质结合RNA对基因组组织和各种核内亚结构形成的贡献。鉴于来自哺乳动物基因组的普遍转录,许多不同类别的ncRNA不仅仅是基因表达的产物,现在因其调节功能而逐渐受到重视。由蛋白质编码RNA覆盖的转录中枢的形成,表明mRNA前体在其加工为成熟mRNA之前或期间也可被视为调节基因表达的lncRNA。未来的研究将致力于了解染色质结合RNA的潜在功能,包括新生的mRNA前体,以及可能作为RNP与染色质相互作用的不同类型的ncRNA。不同的RNA可以作为转录中枢的组织,用于激活或抑制特定的基因表达,或者作为核中相分离过程的介质。大多数已发表的研究都集中在那些从有良好注视的基因组区域里转录的RNA上,但较少的研究关注重复序列衍生的RNA与染色质相互作用,这些RNA也难以区分它们的顺式和反式的行动模式。估计这个快速发展的领域将会在不久的将来取得很多新进展,为发育、分化以及重大疾病过程中的基因功能和调节机制提供提独特视角。
原文链接:
https://doi.org/10.1038/s41576-019-0135-1
制版人:半夏
BioArt,一心关注生命科学,只为分享更多有种、有趣、有料的信息。关注请长按上方二维码。投稿、合作、转载授权事宜请联系微信ID:bioartbusiness 或邮箱:sinobioart@bioart.com.cn。原创内容,未经授权,禁止转载到其它平台。