撰文 | 伊凯
责编 | 兮
由转录组测序技术捕获的高维度基因表达谱作为各种内外生刺激因素的结果和复杂多样的表现型的基础,是在单细胞、组织或个体等层面对宏观生物学状态及微观分子变化进行标定的标准度量之一。基因表达谱的这一特点也使其成为了研究生物体进化与发育过程的分子基础的利器。尽管人们已经对动物发育过程中各组织的来源、形态变化和功能塑造有比较详尽的认识,但对其背后的驱动力的认知还缺乏全面的研究证据。同时,各物种之间虽然具有发育历程上的大体相似性,但也展现出相当程度的变异,例如有袋目动物(marsupial)的器官发育几乎都在出生后开始,这与其他哺乳动物十分不同【1】。因此,如果能利用转录组测序对多物种的发育过程对应的基因表达信息进行刻画,将极大地增进人们对机体发育过程及其与进化的关联的认知。
2019年6月26日,来自德国海德堡大学(Heidelberg University)的Henrik Kaessmann课题组在Nature上发表了两篇背靠背长文,报道了对六种哺乳动物(人、恒河猴、小鼠、大鼠、兔、负鼠)和一种鸟类动物(鸡)的包含三个发育胚层的七个组织(大脑、小脑、心脏、肾、卵巢、睾丸、肝)在从器官发生早期到成年以至衰老的时间跨度上的完整基因表达谱(包括蛋白编码基因和长非编码RNA基因)。这一由近两千个转录组构成的大型数据集是迄今为止对动物发育过程的基因表达信息的最完整刻画。
在获取这一数据集后,作者首先利用PCA降维方法从宏观上探究了各物种的不同器官在发育过程中的基因表达谱相对关联,发现转录组样本依据器官对应的不同胚层和发育阶段得到了明显区分(下图右)。有趣的是,在最初的发育阶段里,各物种的不同器官对应的基因表达谱极为相似,这提示了生物发育起始状态的共同性。
与编码蛋白的基因不同的是,长非编码RNA基因尚不具有完整精确的注释参考。因此,作者对多物种器官的发育过程中的长非编码RNA表达进行分析时,发现绝大多数均为尚未注释的全新RNA(下图)。
基于前述良好的聚类结果,发育过程基因表达谱的一个显著的作用是将复杂的跨物种多器官发育阶段依据基因表达相似程度进行匹配,从而分析它们在基因表达特征上的共性与差异。的确,虽然各类动物在胚胎期(embryonic stage)的发育过程均可依据卡内基分级(Carnegie staging)划分为23个阶段【2】,但对于胎儿期(fetal stage)和产后期(postnatal stage)则并无可靠的跨物种分级方法。因此,作者首先利用线性回归方法分析了每一物种的每一器官中的“发育动态基因”(developmentally dynamicgene, DDG)即在发育过程中表达水平具有显著变化的基因,然后利用这些基因的表达水平对转录组样本间的相关性进行度量,最后再利用动态时间规整算法(dynamic time warping,一种将一组不同长度的时间序列进行扭曲以达到类似形态的算法【3】)将七种动物的发育过程进行了对应(下图左)。作者发现,这一完全基于基因表达信息的物种发育阶段对应关系很好地复现了以机体发育结构为核心的卡内基分级。
另一项表明基因表达与机体发育的紧密关联的证据是重大发育阶段转换事件与转录组剧烈变动的精准对应。例如,作者发现,在胚胎形成时,各物种器官中普遍发生了早期器官发育特异基因的上调和细胞分裂与一般形态生成相关基因的下调;在出生时,则是普遍产生晚期器官发育特异基因的上调和又一轮的细胞分裂与一般形态生成相关基因的下调(下图右)。
类似于对蛋白编码基因的分析,作者对长非编码RNA基因也进行了发育相关性的检验,发现不同于高达73%-90%的蛋白编码基因均属于发育动态基因,仅有16%-38%的长非编码RNA基因具有发育动态特征(下图a)。作者接着对这些发育动态长非编码RNA基因进行功能性分析,发现它们在尺度上显著大于不具有发育动态特征的长非编码RNA基因(下图b)。另外,作者还发现发育动态长非编码RNA基因具有显著更长的进化历史(下图c)、更高的物种间表达相似性(下图d)、更高的细胞增殖功能相关性(下图e)和更多的转录因子结合位点。这些分析很好地揭示了长非编码RNA基因在机体发育过程中的功能相关性。
发育生物学中的一个重要的课题是不同物种间表型差异程度与发育阶段的相关性。早在19世纪,德国生物学家冯·贝尔(von Baer)就提出了“发育沙漏”模型,即物种的形态差异程度在发育过程中首先逐渐缩小,之后又逐渐增大(下图左)【4】。作者因此对基于上述发育阶段对应关系的各时间段上的物种间基因表达相似性进行了度量,发现的确存在相关性随时间发展而显著下降的现象,从而很好地证实了发育沙漏模型的真确性(下图右)。
为了从基因表达特征方面对机体发育在种系特异性阶段之后存在的物种间形态差异逐渐加大这一现象进行解释,作者提出了两个假说:一是机体在发育早期受到较大程度的功能性限制因此难以发生大幅变动;二是机体发育后期存在的由环境因素等导致的适应性变化使得形态变动较为容易。为了证明上述观点,作者对机体发育中的早期特异基因和晚期特异基因的功能性特征进行了比较分析,结果发现,那些在发育过程中经历显著表达水平下调的基因相对上调基因具有更差的对功能缺失突变的耐受性(下图a);同时,对小鼠的致死敲除基因的发育表达特征的分析也发现,随着发育过程的推移,致死基因的表达水平在各组织中均逐渐下降(下图b);另外,对发育特异基因的正向选择程度随时间变化的分析发现其存在显著的时间正相关性(下图c)。因此,上述多项证据均证明了机体的确在发育早期受到更高程度的功能限制,而在发育后期亦受到显著更多的适应性选择的影响。
作者发现,另一个关于机体发育过程中基因表达特征变化的有趣现象是,随着发育的成熟,基因表达的组织特异性亦显著升高,即在各组织中普遍存在的广度下降(下图f)。同时,对组织特异性和发育阶段特异性基因的功能性特征考察发现,两者均具有显著更低的致死效应(下图e)。作者认为,这一可被总结为基因多效性随发育降低的现象亦是对上述发育沙漏模型的贡献因素之一。
最后,为了探究生物发育和各物种进化关系之间的关联,作者考察了不同物种的各器官中随发育阶段的表达路径相对于近似物种发生了显著改变的直接同源基因(ortholog)的数目(下图左)。这一分析发现,同属啮齿目(rodent)的小鼠和大鼠进化出了最多的发育表达路径改变的基因;而在所有物种中,脑几乎都是拥有最少数这类基因的器官。作者认为,这一结果表征了脑是哺乳动物进化最慢的器官(下图右)。
总之,该项研究通过对多个物种的多个器官进行跨发育阶段的转录组信息的完整描绘,以翔实的数据和严谨的分析展示了迄今为止最大规模的动物发育过程基因表达图谱,并有力地证明了多个对个体发育和物种进化有着重大意义的假说或观点。其在为学界贡献了十分宝贵的资源的同时,也极大地启发了发育与进化生物学的研究方向。
原文链接:
https://doi.org/10.1038/s41586-019-1338-5
https://doi.org/10.1038/s41586-019-1341-x
制版人:小娴子
参考文献
1. Ferner, K., Schultz, J. A. & Zeller, U. Comparative anatomyof neonates of the three major mammalian groups (monotremes, marsupials,placentals) and implications for the ancestral mammalian neonate morphotype. J.Anat. 231, 798–822 (2017).
2. Hill, M. A. Early human development. Clinical Obstetrics and Gynecology (2007).doi:10.1097/GRF.0b013e31802f119d
3. Bundy, A. & Wallen, L. Dynamic TimeWarping. in Catalogue of Artificial Intelligence Tools (1984).doi:10.1007/978-3-642-96868-6_63
4. Kalinka, A. T. et al. Geneexpression divergence recapitulates the developmental hourglass model.Nature (2010). doi:10.1038/nature09634BioArt,一心关注生命科学,只为分享更多有种、有趣、有料的信息。关注请长按上方二维码。投稿、合作、转载授权事宜请联系微信ID:bioartbusiness 或邮箱:sinobioart@bioart.com.cn。原创内容,未经授权,禁止转载到其它平台。