纳米孔测序技术,具有超长的测序读长(超过2Mb)、测序速度快等优势,已逐渐成为当今基因组学和表观遗传学研究的利器。近日,香港中文大学生命科学学院张守栋,中国科学院华南植物园罗鸣,香港大学工程学院计算机科学系罗瑞,中山大学中山眼科中心肖传乐等在The Innovation上发文,报道了纳米孔DNA测序和RNA测序的发展及其应用,总结了近年来该技术所取得的成果,并讨论了面临的挑战和未来的前景。
深度神经网络,被广泛应用于碱基识别算法的开发,包括卷积神经网络(CNN)、递归神经网络(RNN),connectionist temporal classification (CTC),大大提升了碱基识别准确率(从小于80%提高至98%以上)。作为长片段测序平台的代表,纳米孔测序近期有望实现N50 > 100 kb的超长读取,更可直接实时测序RNA(DRS),获得mRNA全长序列,因而其比对算法与短读长的二代测序不同,新算法需处理超长读长和高测序错误。不同于利用“种子-扩展”算法的BLAST 和 LAST等传统比对软件,GraphMap、Minimap2、ReadUntil及UNCALLED等软件开发了多种比对策略,在运行速度、结果准确性及比对结果等方面上有了明显的提升。超长读长,可以从头到尾的通读,那些在短读长测序中无法测通的复杂基因区域。基于纳米孔测序的长读长基因组组装有两种策略,即“纠错后组装”和“组装后纠错”。Falcon、Canu和NECAT采用了“纠错后组装”策略。图为纳米孔测序两种基因组组装测序。
纳米孔DNA测序(DDS)长读长的特性,开发了几种检测SV的工具。图为纳米孔 DDS结构变异检测的原理流程图。图为流程图实例。
文献链接:https://doi.org/10.1016/j.xinn.2021.100153
原文链接:https://mp.weixin.qq.com/s/tNCzrHBzoycIbO_QTllPDg
本文节选自“TheInnovation创新”,为清晰表义,略有删减。
请点击阅读原文,下载全文。