能设计新蛋白质的AI再现突破,生成在天然蛋白质中从未见过的拓扑结构

科技工作者之家 2023-07-13

科技日报记者 张梦然

《自然》杂志11日发表的论文描述了一项结构生物学新突破:一种能设计新蛋白质的深度学习方法,名为RoseTTAFold Diffusion(RFdiffusion)。其能生成各种功能性蛋白质,包括在天然蛋白质中从未见过的拓扑结构。

研究示意图(部分)图片来源:《自然》网站

深度学习推动了蛋白质结构的预测和设计,但仍需一个通用框架来克服在蛋白质设计上遇到的各种挑战。扩散模型是一种生成式模拟方法,已被证明在图像和文本生成中很有用,而且似乎也适用于蛋白质设计。然而,这类模型目前的成功率并不高,产生的序列基本不能折叠成目标结构。

美国华盛顿大学科学家研究表明,通过细调之前报道过的RoseTTAFold的结构预测网络,将其整合到一个降噪扩散模型中,就能生成具有实际意义的蛋白质骨架,而蛋白质骨架决定了蛋白质的形状和功能。RFdiffusion模型能测试拥有不同结构元素的设计组合,并从头开始产生蛋白质。该模型还能执行不同的任务,设计单体(蛋白质的基本组成单位)、寡聚体(多亚基聚体)、有治疗或工业应用前景的复杂结构。

团队对数百个设计出的对称聚体、金属结合蛋白和结合蛋白的结构和功能进行了实验表征,证明了该方法的实用性。他们生成了RFdiffusion设计的一种结合蛋白与其底物(此处为流感血凝素,一种在流感病毒表面发现的蛋白)的复合物并分析了其结构,发现结果与设计的模型几乎一模一样,从而证明了该方法的准确性。

研究人员表示,RFdiffusion是对目前蛋白质设计方法的一次综合改进,能产生总长度达600个残基的结构,复杂性和准确度都比之前更高,未来对该方法的进一步改进将能设计出复杂程度更高的新蛋白。