跨越三大生物域百余物种的蛋白质组图谱

科技工作者之家 2020-07-06

来源:BioArt

撰文 | 伊凯

蛋白质是生命体功能的主要执行者,其数目与类型之庞杂、可变体结构特征之繁复、翻译后修饰种类之丰富,以及蛋白间相互作用之高度动态和环境依赖,使得对于全蛋白组的解构较其它组学测量而言更加繁琐和具有挑战性。尽管近年来伴随着蛋白芯片和定量质谱等技术发展,领域内涌现出了跨越多类生理病理状态的大规模蛋白组及互作组图谱,如专注于癌症样本的CPTAC【1】、RPPA【2,3】,专注于正常组织样本的HPA【4】和HPM【5】,及专注于PPI的BioPlex【6-8】和 humancellmap【9】等;蛋白组数据的规模仍然远逊于转录组及基因组数据。这一差异在跨物种比较分析中则尤其突出。
为了填补跨物种蛋白组测量的空缺,近日,来自德国马克斯·普朗克研究所等机构的科学家们在Nature上发表了题为The proteome landscape of the kingdoms of life的文章,首次报道了利用定量质谱技术构建的跨越三大生物域(真核域、细菌域、古菌域)的一百种生物的大规模蛋白组分析,为基于蛋白层面的进化比较分析提供了宝贵的资源。
wt_a12302200706122723_b88b74.jpg
在该研究中,作者综合考虑物种样本可获取性、基因组注释完整性及模式生物的普遍利用度等因素,选取了古菌域的19种生物、细菌域的49种生物和真核域的32种生物作为蛋白组分析的对象。在利用质谱分析得到了超过两百万个肽段的基础上,作者从中识别出三十五万个不同的蛋白质,包含真核域的二十六万个、细菌域的六万五千个及古菌域的一万七千个。有趣的是,这三十五万个蛋白质所对应的一百一十三万个基因元件,高达93%的符合UniProt中TrEMBL项目的根据基因组序列的预测结果,但仅有五十六万个在Swiss-Prot项目中具有对应的实验证据。也即是说,该研究所产出的数据一次性将物种已知存在蛋白的数量扩大了一倍以上。
在蛋白表达量的物种差异方面,作者发现,对于真核域而言,平均1546个蛋白即可占据超过90%的蛋白总质量,而这一数字对于细菌域和古菌域来说分别为306和262。对上述高表达蛋白的功能注释分析则发现,那些与生命运作的基本需求所相关的功能呈现出了极高的富集性,如蛋白质翻译、蛋白质折叠及氧化还原反应等。
最后,作者还观察到,被识别出的接近40%的蛋白不具有任何功能性注释条目。即使是只考虑表达量处于前一百位的蛋白质,这一数字仍高达22.9%。大量未经实验验证或缺乏功能注释的蛋白质“暗物质”的存在不仅意味着学界对生物体蛋白质组全貌的探索仍然远未完成,同时也指向了在对新蛋白质的发掘、对现有蛋白质功能注释的丰富及对蛋白质进化和保守性分析等方面的前所未有的宝贵机遇。
wt_a62302020076122723_bc6d9a.jpg
原文链接:https://www.nature.com/articles/s41586-020-2402-x.pdf

来源:BioGossip BioArt

原文链接:https://mp.weixin.qq.com/s?__biz=MzA3MzQyNjY1MQ==&mid=2652490381&idx=4&sn=9fd5c1834d261cc78e991da76cac9d03&chksm=84e25939b395d02f2fd8b7b671499a0cbeb19688601fdd86ad9de49b269be86cc35c97398dcc#rd

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

蛋白质 al

推荐资讯