问:本次发表的新方法和传统的蛋白-DNA互作研究方法相比,主要有什么改进?
答:传统的基于ChIP-seq的蛋白-DNA互作研究方法,利用抗体免疫沉淀后富集的打断后DNA片段短读长测序并进行peak calling,反映了特定DNA位点的蛋白结合平均信息。但传统方法无法获得每一个大片段DNA分子上蛋白结合的真实状态,无法进行DNA复杂结构域蛋白-DNA交互作用分析。
本次发表的新方法(BIND&MODIFY),通过对完整、不打断的大片段DNA分子进行特异性分子标记,通过长读长测序,获得高精度、DNA单分子水平上的组蛋白修饰、DNA结合蛋白序列信息,进一步同时获得DNA异质性、CpG甲基化多组学、复杂结构域的蛋白-DNA互作等信息。
问:该技术研发过程中的关键点和主要结果主要有哪些?
答:本技术的关键点与主要结果在于,首先,构建一种基于葡萄球菌蛋白A-甲基转移酶融合蛋白,对蛋白-DNA结合位点进行特异性修饰与单分子测序检验的方法;其次,设计开发了一套针对大片段单分子DNA上的蛋白-DNA交互作用的位置信息进行分析的算法流程,实现了高精度的蛋白-DNA交互作用检测、DNA分子在蛋白-DNA结合水平上的异质性鉴定、蛋白-DNA交互作用强度在DNA长距离上远端互作鉴定、CpG甲基化联合分析、以及DNA复杂结构域的蛋白-DNA交互作用检测方法。
本方法(BIND&MODIFY)首先构建了一种葡萄球菌蛋白A-甲基转移酶融合蛋白(pA-M.EcoGII);将针对组蛋白修饰、DNA结合蛋白特定抗体与细胞孵育后,pA-M.EcoGII与特异性抗体结合;随后激活甲基转移酶活性,将抗体结合蛋白附近的DNA序列中的腺嘌呤(adenine)高效率转化为N6-methyladenosine (m6A);最后通过纳米孔单分子长读长测序对m6A位点进行检测,获得单分子水平的高精度蛋白-DNA结合位点信息(图1)。
图1 本方法(BIND&MODIFY)技术路线流程图
进一步地,通过与传统ChIP-seq对标,本方法在检测组蛋白修饰H3K27me3水平上,具有接近的趋势、较高的相关性以及相近的精度(图2)。在染色质复杂结构域LTR区域,本方法具有优于传统ChIP-Seq的检验精度(图3)。
图2 本方法与传统ChIP-seq相比,具有高度相关性
图3 本方法在染色质复杂区域LTR区域具有优于ChIP-seq的分辨率
通过分析结合位点转录起始位点(TSS)上游1000-0bp的m6A比率,本方法能够进行DNA分子聚类(图4),通过gene ontology分析,发现异质性较高的DNA分子(cluster 3)与乳腺癌相关通路相关, 如VEGF singling pathway, B cell receptor signaling pathway, PD-L1 checkpoint pathway等。本方法首次实现了单分子水平上的基于组蛋白修饰H3K27me3的DNA异质性鉴定。
图4 本方法实现DNA分子在蛋白-DNA结合水平上的异质性鉴定
最终,本方法通过对大片段DNA分子上的蛋白-DNA交互作用相关性进行分析,构建了反映DNA分子上蛋白-DNA作用相关性的correlation coefficient (CC)分析方法,以及反映分子上蛋白-DNA作用强度的distance effect (DE) index分析方法(图5),实现了组蛋白修饰H3K27me3与DNA结合蛋白CTCF在单分子水平上的远端作用互作检测。
图5 本方法实现蛋白-DNA交互作用强度在DNA长距离上远端互作鉴定
简而言之,本方法(BIND&MODIFY)是一种具有普适性、高质量、高精度的单分子水平上实现蛋白-DNA交互作用检测的方法,该技术能够在单分子水平上,为解析细胞命运决定与功能异质性的表观遗传学调控机制提供一种强有力的工具。
问:我们看到斯坦福也同期发表了类似的技术,两种技术有什么相似和区别之处呢?
答:两篇文章异曲同工,分别构建了两种高效率的葡萄球菌蛋白A-甲基转移酶融合重组蛋白,针对蛋白-DNA交互作用进行单分子水平上的检测,并同时进行CpG甲基化测序获得了多组学蛋白-DNA交互作用检测。
差异点主要在于,唐冲博士团队系统地比较了本技术与传统ChIP-seq在蛋白-DNA互作的相关性、分辨率等方面的差异,发现本技术与ChIP-seq具有相近的性能表现;同时进行了基于蛋白-DNA交互作用在单分子水平上的异质性,对DNA分子进行聚类分析,发现与癌症相关的基因调控异质性信息;基于DNA分子的异质性,发现了蛋白-DNA互作在DNA长距离上的远端交互作用特征;完成了转座子长末段重复区域LTR、SINE、LINE等短读长测序检测受限区域的蛋白-DNA互作信息检测。斯坦福团队则主要在体外构建了人工组蛋白-DNA复合物,验证了其方法的特异性与分辨率,并针对着丝粒附近的CENP-A 组蛋白与DNA交互作用信息进行了检测与分析。
问:该技术未来发展的实际应用场景主要有哪些?
答:该技术作为传统ChIP-seq测序技术在单分子长度长测序领域的原创性升级,具体应用场景还是比较丰富,比如可以系统性研究蛋白-DNA交互作用在单分子水平的作用特征,发现特异性蛋白在单分子水平调控基因启动与表达的动态特征。
发现细胞类群内蛋白-DNA交互作用的异质性,进一步在单分子水平上精确定义细胞类群;同时还可以联合CpG甲基化测序,获得5mC甲基化位点与蛋白-DNA交互作用在单分子水平上的综合调控机制,并通过结构变异与蛋白-DNA交互作用分析,实现边测序、边组装,同时获取基因组水平的蛋白-DNA交互作用信息。
总之,该技术能够在长读长测序领域,为广大研究者提供了一种新型研究方法与范式,系统实现蛋白-DNA交互作用信息与多组学信息的综合分析。
问:基于此技术后续还有哪些补充工作?
答:华大基因唐冲博士团队正在对该技术进行优化,检测更多与人类疾病相关的蛋白-DNA交互作用上进行系统分析,为后续新型药物靶点发现提供基础;同时正在进行基于该技术的单分子多组学测序方案的一步优化,实现在同一根DNA分子上的更多维度的单分子多组学检测。
论文链接:
https://www.biorxiv.org/content/10.1101/2021.07.08.451578v1