Cell:植物领域又一工具,植物蛋白互作数据库

科技工作者之家 2020-05-03

来源:植物科学最前沿

我们都知道,植物是地球上最重要的组成部分,为人类提供经济来源和必要的生活环境。虽然说已有大量植物物种完成了基因组的测序和组装,但无论在模式植物拟南芥抑或水稻中,已解析功能的基因仍占少数。即使研究深入如拟南芥,也仅仅只有5%的基因有实验验证,知道其生化,蛋白定位及生物学功能。众所周知而且显而易见的是,蛋白一般都是通过互作形成复合体来行使功能的,但对植物体内蛋白质复合体的研究,却是远远落后于人以及模式生物酵母或果蝇。

因此,美国得克萨斯大学奥斯汀分校Edward M. Marcotte课题组的McWhite等利用Co-fractionation MS (CF-MS)方法检测了13个绿色植物物种,这13个物种跨越11亿年的进化历程,它们是拟南芥,甘蓝,大豆,大麻,番茄,藜麦,玉米,粳稻,小麦,椰子,蕨菜,卷柏和衣藻(图1A)。这些物种的选择涵盖了绿色植物界大部分的植物类型,从而确保可以获得一个多样且有代表性的蛋白质互作组学数据集。由于植物进化过程中多倍化的影响,存在大量的同源基因。为了准确地识别并对这些同源蛋白进行定量,作者开发了一种新的检测方法:evolution-informed proteingrouping approach。这种方法是利用直系同源群(orthogroups,OG)而不是单个蛋白来注释质谱数据:一个直系同源群(OG)是指来衍生于最近的祖先种中同一原始基因的一组基因(图1D)。这样,就可以通过OGs中其组成蛋白的质谱数据计算OGs丰度(图1E),而且不同于单个蛋白,OGs数据也可以用来整合不同物种中的数据,进行相互比较。

wt_a52352020004001203_37f7e7.jpg

图1 CF-MS工作流程图

跟物种倍性一致,二倍体物种每个OG中大多为一个蛋白,而四倍体物种(具有两套基因组)中最多的为两个同源蛋白(一套基因组中一个),六倍体小麦(三套基因组)则为三个同源蛋白(图2A)。

wt_a72342020050001203_3abb09.jpg

图2 Proteomics in High-Ploidy Species Enhanced by Assignment of Proteins to OGs

最终作者总共鉴定到141,910 unique proteins以及23,896 OGs,涵盖了绿色植物基因组96.7%的保守OGs。这是迄今为止对植物进行的最大的蛋白质组学调查,涵盖了广泛的功能区域,向我们展示了一个绿色植物中保守且表达的蛋白组图景。

接下来我们看看这个图景中有什么有意思的现象:

1 作者发现在约半数的有三个或者多个蛋白组成的OGs中,都有一个优势蛋白(dominant protein),那个对于其他OGs组成蛋白高表达(图2E)。

2 检测到的蛋白更多的是高丰度mRNA的产物,但是蛋白丰度与RNA转录水平并不是完美对应的,转录后,翻译以及蛋白降解速率都影响着蛋白的稳定(图2F,G)。

得到这些数据后,作者利用监督机器学习(supervised machine learning)方法,以已知的复合体检测数据作为训练集进行模型训练。然后 对蛋白互作进行系统的识别与打分。

同时,为了验证检测结果的正确性,作者对检测到的互作进行了验证。作者发现高CF-MS值的互作用其他互作检测方法也可以检测到(图3D,E)。进一步地,作者还利用两种无针对性的大规模生化方法对CF-MS检测结果进行了验证(图4A,B)。这些结果都证明CF-MS可以准确检测植物体内蛋白复合体的存在。

wt_a12302200504001203_3dddac.jpg

图3 蛋白互作的多种方法验证

wt_a72342020050001204_418803.jpg

图4 通过Calibrated Molecular Mass Determination 和 Direct Chemical Cross-Linking方法验证蛋白复合体

作者通过这个CF-MS数据,鉴定出了一些之前报道过的蛋白复合物,令人兴奋的是,作者同时也发现了一些在植物中未报道过的新的蛋白复合体(图5,黄色部分),有些复合体中含有一些迄今尚未有功能注释的蛋白(图5,实心圆圈),作者鉴定到了这些互作将会极大地推动我们对植物基因功能的认识。

wt_a42302020504001204_443aa1.jpg

图5  进化保守的植物蛋白复合物图景

归根结底,蛋白互作数据集的作用是用来推动植物生物学的发展。而相互作用的蛋白更可能调控同一表型,因此这一数据的应为将基因型与表型的关联以及对相似表型的生化解释提供基础。

最后,总结一下这一资源将为我们的研究带来的影响:

植物蛋白互作数据集的释放,不仅为我们展示了绿色植物界保守蛋白互作的整体图景,还会对我们未来功能基因组研究产生深远影响。

1 基因功能研究时,我们可以直接通过该数据库进行互作蛋白的筛选,可以大概率免去自己建库或者转基因的痛苦。

2 通过互作蛋白的搜索,打开自己的研究思路。

3 蛋白互作对表型造成影响的相关性要远远大于转录水平上的共表达分析,未来组学研究时,可能将会增加蛋白互作组部分。

4 该研究可能会改变植物功能基因组研究范式,极大推动植物基因功能研究的进程。

来源:frontiersin 植物科学最前沿

原文链接:https://mp.weixin.qq.com/s?__biz=MzIyOTY2NDYyNQ==&mid=2247494771&idx=2&sn=874f028b24b6ba580fd782ca667cdeb5&chksm=e8bd9e6ddfca177becd334f10aafcdacd7ea0ed52f7a45086f8bcb7045e268078a0f58ad5be7#rd

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

蛋白复合物 单个蛋白

推荐资讯