探索发现 · 交大智慧

医工交叉,数据驱动

上海交大医学院附属九院沈键锋团队与上海交大网络信息中心交我算团队合作揭示异常剪切体蛋白结构

2023年8月4日,上海交通大学医学院附属第九人民医院沈键锋团队与上海交通大学网络信息中心交我算团队合作于Nature子刊Scientific Data上发表了题为“Structure prediction of novel isoforms from uveal melanoma by AlphaFold”的研究论文,首次全面系统地预测了葡萄膜黑色素瘤中高频异常剪切异构体的蛋白结构,为后续识别癌症新抗原及潜在治疗新靶点等多种类型的研究奠定了基础。

1.png

葡萄膜黑色素瘤(Uveal Melanoma,UM)是成人最常见的眼内恶性原发性肿瘤,其恶性程度高,严重威胁患者生命。特定的可变剪切异构体与包括葡萄膜黑色素瘤在内的多种肿瘤发生有关。混合测序策略是以三代测序数据作为基础和重点,将三代测序长读段与高质量二代测序短读段数据结合在一起,充分利用两个技术平台的优势,是目前全局精准检测可变剪切事件的高效办法之一。尽管在研究不同异构体的选择性剪切机制和功能方面付出了巨大努力,但我们对剪切异构体3D结构的了解仍非常有限,因此需要全面系统研究其3D结构从而探索其生物学功能。AlphaFold是一种深度学习算法,在预测氨基酸序列的3D蛋白质结构上获得了很高的准确度。这项重大进展对蛋白质功能的研究产生了深远的影响。

在此项工作中,研究人员建立混合测序分析平台,基于18 名葡萄膜黑色素瘤患者肿瘤组织的二代及三代转录组测序数据,分别利用pinfish及flair分析流程重建转录异构体,共得到了315个未经注释的高频(出现于10个样本及以上)可变剪切异构体(图一)。为了更好地了解异构体的结构差异及其潜在影响,研究人员比较了295个剪切异构体编码的异常蛋白与其基因编码的正常蛋白之间的结构差异。此外,研究人员还在10种氨基酸序列发生改变的剪切异构体中鉴定出了13个潜在新抗原(图二)。该项研究是混合测序策略在识别葡萄膜黑色素瘤转录异构体及鉴定其可变剪切事件上的首次应用。同时,这也是首次使用AlphaFold系统全面预测葡萄膜黑色素瘤中可变剪切异构体的3D结构。这项研究也为基于蛋白质结构预测新抗原和潜在药物新靶点提供了理论依据。

微信图片_20230808093611.jpg

图一 该项研究的技术路线

3.png

图二 可变剪切衍生的潜在新抗原检测

交我算团队专注于提供学科融合服务,帮助全校课题组有效利用高性能计算、AI计算和云计算等强大计算资源。团队由30多人组成,来自物理、化学、生物、材料等多个学科,致力于全校科研计算交叉与创新。学科融合服务包含三项:优化代码以提高科研团队的计算效率,开发软件以满足不同的学科和研究需求,以及深度参与到科研项目中,与科研团队共同推进科研项目的进展。本次科研成果中,交我算团队全程参与了研究过程,这是网络信息中心首次以第一或通讯作者的身份在Nature子刊上发表研究成果。

此项工作的蛋白结构已发布在由交我算团队打造的科学数据平台 (https://scidata.sjtu.edu.cn) ,供全球研究者下载。平台依托交我算的强大算力和海量存力,遵循国际通行的可发现(Findable)、可访问(Accessible)、可互操作(Interoperable)、可重用(Reusable)的FAIR科学数据开放原则,旨在解决科研过程中的数据“产生-分析-发布”管理难题。全校教师均可通过jAccount登录使用,轻松完成数据汇交、审稿预览、数据发布、下载公共数据集等操作。将数据托管在科学数据平台,不仅具有规范、安全、便利的优点,还能发挥集聚效应,扩大我校科研数据成果的国际影响力。

4.png

图三 蛋白结构发布在科学数据平台

上海交通大学医学院附属第九人民医院助理研究员张哲,上海交通大学网络信息中心李琛,为该论文的共同第一作者。上海交通大学医学院附属第九人民医院沈键锋教授,上海交通大学网络信息中心林新华副主任,上海交通大学医学院附属第九人民医院助理研究员张哲,为该论文的共同通讯作者。此项工作得到了国家重点研发计划(2021YFC2701103)、国家自然科学基金面上项目(No.81972667)以及上海市双百人计划(No.20191817)等资金资助。

论文链接https://www.nature.com/articles/s41597-023-02429-z

数据链接https://scidata.sjtu.edu.cn/records/t3jf0-fah63

上海交通大学医学院附属第九人民医院、上海交通大学网络信息中心
上海交通大学医学院附属第九人民医院、上海交通大学网络信息中心