CRISPR/Cas9核酸酶基因编辑系统被广泛应用于基础科研领域。它通过guide RNA (gRNA) 与DNA配对,在靶向位点产生DNA双链断裂 (DNA double-stranded break, DSB),再利用细胞对DSB的修复产生基因突变从而完成基因编辑。除了脱靶活性一直制约着其在临床治疗上的进一步应用,美国NIH Somatic Cell Genome Editing Program在今年发表的Nature文章中还强调了要重点关注基因编辑过程中产生的染色体结构变异,如染色体易位,染色体大片段缺失等,并建议开发相关检测方法【1】。
早在2019年,北京大学生命科学学院和北大-清华生命科学联合中心胡家志课题组就开发了全面评估基因编辑安全性的方法PEM-seq (Primer-extension-mediated sequencing)【2】,可以从一个测序库中同时检测编辑活性、脱靶活性、和染色体异常结构等信息。利用该方法,课题组进一步回答了一系列相关问题:基因编辑过程中染色体结构变异的产生有怎样的频率以及规律特征?DNA损伤修复在其中起着怎样的作用?以及目前该领域存在的诸多Cas9变体对基因组的稳定性影响又如何?
近日,胡家志课题组在Nuclei Acid Research发表了两篇论文,题为Global detection of DNA repair outcomes induced by CRISPR-Cas9 和In-depth assessment of the PAM compatibility and editing activities of Cas9 variants,阐述了Cas9基因编辑产物的规律特征,揭示了基因编辑过程中的不稳定因素,并且详细评估了该领域内常见Cas9变体的编辑活性和对基因组稳定性的影响,更为安全基因编辑提供了重要启示。
作者首先在2019年发表的PEM-seq实验方法的基础上,开发了全面分析Cas9编辑产物的新生物信息分析工具PEM-Q(图1a),该工具不仅可以分析Cas9编辑所造成的小规模插删(small insertions and deletions,indels), 还可以分析编辑过程中造成的大片段缺失、质粒插入和染色体易位等染色质异常事件。作者利用PEM-Q在多种人和小鼠的细胞系中对Cas9进行了全面评估,以CH12F3中的c-Myc位点为例,作者发现Cas9在靶向位点产生indels的同时,还会造成占编辑事件近3%的染色体大片段缺失,近3%的染色体易位,近1%的外源DNA片段(质粒,病毒载体)插入(图1b-d)。其中小规模插删是Cas9在靶向位点产生的数个碱基(小于20个)的插入或者缺失的编辑产物,它造成基因读码框的偏移从而造成基因突变,是基因编辑中的主要目的产物;而染色体易位是编辑位点与其他染色体上的DSB发生连接产生的异常产物。靶向位点倾向于与Cas9的脱靶位点以及基因转录活跃区域发生连接,并与染色质三维结构相关(图1c左),染色体易位是一种危险的染色体结构变异,常常与血液和神经相关肿瘤的发生相关联;除此之外,Cas9还会在编辑位点处造成数百bp至数百kb长度的染色体大片段缺失,这种副产物造成了遗传物质的缺失(图1c右);对于外源DNA片段的插入,作者发现质粒或者病毒载体上的易断裂位点易整合到靶向位点导致外源DNA的插入,研究表明病毒DNA的插入可以影响其附近染色体的状态,与肿瘤的发生有一定关系。作者发现这些副产物在不同细胞系,不同位点之间的分布表现出很大的差异(图1b),这些都说明了使用CRISPR-Cas9进行编辑前进行全方位评估的必要性。
为了减少Cas9的脱靶活性以及拓宽Cas9的靶向范围,该领域工作者开发出了多种Cas9变体。作者进一步利用PEM-seq全面评估了现今常用的8种Cas9高保真变体 (eSpCas9, FeCas9, HF1, Hypa, evo, Hifi, LZ3, Sniper ) 以及4种靶向范围更广泛的广域编辑变体 (xCas9, Cas9-NG, SpG, SpRY)【3,4】。对于高保真变体,作者验证了其牺牲了切割效率来提高特异性的均衡模型,并发现eSpCas9, FeCas9, HF1, Hypa在大部分位点表现优异;而对于广域编辑变体,作者在验证其靶向范围更加广泛的同时 (xCas9活性较差),也发现了它们具有更加严重脱靶活性(图2a, 2b)。以PAM识别序列为NNN的SpRY为例,作者在多个位点检测到了数十至数百个脱靶位点,并以此开发了一套深度学习的模型来准确预测其脱靶位点(图2b, 2c);进一步,该工作发现无论是野生型Cas9还是Cas9变体,它们都会造成相近比例染色体易位、染色体大片段缺失等染色体结构变异;而对于广域编辑变体而言,它们还存在着切割自身表达载体,从而导致大量外源DNA插入靶向位点以及在基因组上随机插入的问题(图2d);最后作者通过将高保真变体的突变与SpRY进行组合,找到了三个靶向范围广且脱靶效率低的Cas9新变体。
该工作向我们提示了随着基因编辑在临床应用上的不断延伸,Cas9的安全性评估不应该仅局限于脱靶活性,染色体结构变异也是一种必然发生且比例不低的基因编辑副产物,而该副产物往往具有不可控性以及不可预测性,但又与癌症的发生相偶联,应该得到重视。目前来看,染色体异常结构不能通过Cas9高保真变体减弱,而以往通过抑制DNA损伤修复通路来增强同源重组效率的方式也并不可取,因为这往往会影响DNA损伤修复造成更多的DNA损伤,对基因组稳定性带来更大的危害。所以目前亟需寻找一种既可以保持基因编辑工具编辑活性又能有效降低脱靶活性和染色质结构变异的基因编辑工具。这样,才能让基因编辑工具更安全地应用于临床。
北京大学胡家志研究员为两篇文章的通讯作者。第一篇文章中,博士研究生刘孟竺,张微微,辛昌昌为共同第一作者。第二篇论文中,张微微为共同第一作者,尹健行为共同第一作者兼共同通讯作者。张丁峥嵘,尚雅芳,王渝鸿,艾晨,李嘉欣在该工作中亦有重要贡献。该文章还得到了上海生化所孟飞龙研究员的支持与合作。
原文链接:
https://doi.org/10.1093/nar/gkab686
https://doi.org/10.1093/nar/gkab507
参考文献
1. Saha, K. et al. The NIH Somatic Cell Genome Editing program. Nature 592, 195-204, doi:10.1038/s41586-021-03191-1 (2021).
2. Yin, J. et al. Optimizing genome editing strategy by primer-extension-mediated sequencing. Cell Discov 5, 18, doi:10.1038/s41421-019-0088-8 (2019).
3. Anzalone, A. V., Koblan, L. W. & Liu, D. R. Genome editing with CRISPR-Cas nucleases, base editors, transposases and prime editors. Nat Biotechnol 38, 824-844, doi:10.1038/s41587-020-0561-9 (2020).
4. Schmid-Burgk, J. L. et al. Highly Parallel Profiling of Cas9 Variant Specificity. Mol Cell 78, 794-800 e798, doi:10.1016/j.molcel.2020.02.023 (2020).