由新冠病毒(SARS-CoV-2)引起的疫情仍在世界各国肆虐。据最新统计数据显示,截止2021年3月,全球新冠肺炎累计确诊病例数超1.1528亿例,累计死亡超255万例。新冠疫情的防控、理解新冠RNA感染和复制等分子机制、抗病毒药物及疫苗的开发仍是当下的主要任务。
2021年3月4日,武汉大学病毒学国家重点实验室周宇、陈宇及蓝柯团队合作在知名学术期刊-Molecular Cell在线发表题为 “The SARS-CoV-2 Subgenome Landscape and its Novel Regulatory Features”的研究论文。该研究结合Nanopore、 NGS测序技术及传统研究手段,利用多种新冠病毒细胞感染模型构建了新冠病毒亚基因组的时序动态图谱,发现了在病毒亚基因组生成过程中的新模式,并揭示了介导新冠病毒亚基因组生成中的RNA-RNA互作规律及关键特征(图1)。为理解新冠病毒的感染与复制过程以及抗病毒药物和疫苗开发提供了新的线索。
图1 实验策略、新冠病毒亚基因组生成模式及调控特征概览
新冠病毒是一种单股正链RNA包膜病毒,基因组长约30,000 nt。之前的研究显示,冠状病毒以正链RNA基因组为模板利用RdRP合成负链RNA。其中,连续合成可产生互补的全长负链基因组RNA,而不连续合成则通过模板跳跃产生不同长度的负链亚基因组RNA (sgRNA)。这些负链RNA中间体作为模板可经由RdRP合成正链子代基因组RNA和亚基因组RNA,由此完成基因组的复制和转录过程。生成亚基因组RNA过程中的模板跳跃及不连续合成称为“模板转换”(template switch),这是病毒高效生成可翻译RNA的途径。
在本研究中,该团队利用2005年研究SARS冠状病毒亚基因组复制转录的经验及传统手段,进一步整合Nanopore长读长测序与NGS深度测序技术及生物信息学分析,建立了绿猴Vero E6细胞系和人类Caco-2细胞系在感染新冠病毒后不同时间点的病毒亚基因组动态图谱,鉴定出7499个template switch位点,并重构出433条(208个cluster)高置信度的全长亚基因组序列。定量分析发现新冠病毒亚基因组中multi-switching(一个亚基因组中出现两个或两个以上的template switch事件)现象中的多个模板转换事件可级联发生。
该研究进一步探索了控制亚基因组生成效率的调控特征。通过分析介导亚基因组生成的RNA互作模式和配对能量,发现新冠病毒在亚基因组生成过程中除了经典的“positive-to-positive template switch”模式(正链模板合成负链sgRNA过程中发生的template switch),也有部分亚基因组是由“negative-to-negative template switch” 模式(负链模板合成正链sgRNA过程中发生template switch)产生的。并发现新冠病毒不同亚基因组sgRNAs的丰度与template switch位点周围RNA-RNA配对能量、连续配对长度,特别是末端配对状态相关(图2)。以前的template switch模型认为,特定的TRS-motif介导了template switch的发生。该研究发现有相当种类的亚基因组缺少TRS-motif支持,揭示更加泛化的RNA-RNA互作而非特异TRS-motif是调控病毒亚基因组RNA生成的分子基础。
图2 解析新冠病毒亚基因组生成调控规律示意图
此外,该研究发现新冠病毒在ORF1ab基因与N基因区域存在分布广泛、种类多但丰度较低的非经典template switch事件(ORF1ab类型),该现象在新冠病毒感染的不同样品中均存在。通过对公开的新冠病毒感染的Ribo-seq和质谱数据分析,发现部分ORF1ab类型亚基因组可能拥有编码新蛋白/肽段的潜力。这一研究比较全面地揭示了新冠病毒亚基因组sgRNA的生成模式和调控规律,为开发新的抗病毒药物提供了潜在的靶点和新思路。
周宇教授、陈宇教授与蓝柯教授为该论文的共同通讯作者,武汉大学生命科学学院博士生王得和、江翱、冯姜鹏、李广楠和郭冬为该论文共同第一作者,中科院武汉病毒所石正丽研究员、杨兴娄研究员、武汉大学陈明周教授、郭铭老师、博士生刘乾运等参与了本研究。研究工作得到了武汉大学动物三级生物安全实验室的大力支持以及武汉大学新冠科技攻关专项基金、北京泰康溢彩公益基金会、国家自然科学基金新冠病毒专项等资助。
中山大学医学院感染免疫中心郭德银教授点评
新冠病毒是一种包膜RNA病毒,属于β冠状病毒属,具有约30,000 nt长的正链RNA基因组,是已知RNA病毒中基因组最长的一类病毒,因此其基因组的结构及其复制转录机制非常复杂。冠状病毒编码16种非结构蛋白和4种主要的结构蛋白及多种附属蛋白,后两类蛋白需要通过不连续转录而形成的亚基因组RNA(sgRNAs)进行表达,但这种不连续转录机制一直不是十分清楚。冠状病毒RNA的复制转录模型假设最早在1983年由Ralph Baric提出,随后由Brian和Sawicki等人逐渐发展[1–4]。2002年SARS疫情暴发后,我们研究团队利用逆转录PCR、克隆测序和Northern Blot技术鉴定了SARS冠状病毒的十个sgRNAs,其中包括两个新型的sgRNAs;鉴定出转录调控核心序列ACGAAC;并证实负链不连续转录机制的存在[5],但是这种低通量的方法往往无法鉴定全部的亚基因组,尤其是低丰度sgRNA,而且分辨率有限。Wang et al.的研究结合二代(NGS)和三代(Nanopore)测序技术,构建出高分辨率的新冠病毒亚基因组图谱,深入和系统地解析了新冠病毒亚基因组生成的调控机制,取得了更全面和新的认识。经典复制模型中模板跳跃发生在从正链基因组RNA到负链亚基因组RNA的转录过程中,而该研究发现模板跳跃也可以发生在从负链基因组RNA合成正链亚基因组RNA的过程中,且亚基因组RNA在生成的过程中也可以级联发生多次模板跳跃生成更短的亚基因组RNA。进一步发现模板跳跃并不都是依赖于已知的TRS序列,只需要形成稳定的RNA-RNA相互作用即可介导发生模板跳跃。总之,该研究所使用的新一代的高通量测序技术为研究病毒感染过程中的RNA生成及加工提供了强有力的手段,为我们认识冠状病毒和开发新的抗病毒策略提供了全新的分子基础。
参考文献
[1] Baric R, Stohlman S, Lai MMC. Characterization of replicative intermediate RNA of mouse hepatitis virus: Presence of leader RNA sequences on nascent chains. J. Virol. 1984;48:633–640.
[2] Brian DA, Chang R-Y, Hofmann MA, et al. Role of subgenomic minus-strand RNA in coronavirus replication. In: Brinton MA, Calisher CH, Rueckert R, editors. Posit. RNA Viruses. Vienna: Springer Vienna; 1994. p. 173–180.
[3] Sawicki SG, Sawicki DL. Coronaviruses use Discontinuous Extension for Synthesis of Subgenome-Length Negative Strands. In: Talbot PJ, Levy GA, editors. Corona- Relat. Viruses Curr. Concepts Mol. Biol. Pathog. [Internet]. Boston, MA: Springer US; 1995. p. 499–506. Available from: https://doi.org/10.1007/978-1-4615-1899-0_79.
[4] Sawicki SG, Sawicki DL. A New Model for Coronavirus Transcription. In: Enjuanes L, Siddell SG, Spaan W, editors. Coronaviruses Arter. [Internet]. Boston, MA: Springer US; 1998. p. 215–219. Available from: https://doi.org/10.1007/978-1-4615-5331-1_26.
[5] Hussain S, Pan J, Chen Y, et al. Identification of Novel Subgenomic RNAs and Noncanonical Transcription Initiation Signals of Severe Acute Respiratory Syndrome Coronavirus. J. Virol. 2005;79:5288–5295.
本期编辑:木木