翟继先课题组:覆盖20,068个拟南芥转录组数据

科技工作者之家 2020-08-06

来源:BioArt植物

在过去的十年里,随着测序成本的降低和文库构建方法的发展,RNA-seq已成为继microarray之后研究基因表达的黄金标准。到目前为止,公共数据库释放的拟南芥相关的RNA-seq文库数目已经超过20,000个。这些海量数据资源对研究基因的转录调控,组织特异性,胁迫处理以及不同发育阶段的基因表达是十分宝贵的资源。然而,如何高效地利用如此庞大的高通量测序数据资源,对于研究者来说是一个巨大的挑战,特别是对于缺少编程基础的实验人员或者计算资源短缺的研究团队。
2020年8月4日,南方科技大学生物系植物与食品研究所翟继先课题组在Molecular Plant在线发表了可以方便快速查询超过两万个公共RNA-seq文库的在线资源,论文题为A comprehensive online database for exploring ~20,000 public Arabidopsis RNA-Seq libraries。该数据库(Arabidopsis RNA-seq database, ARS)整合了来自GEO、SRA、ENA和DDBJ数据库的20,068个拟南芥RNA-seq数据,提供了一个在线的“Google-style”查询工具。该研究对所有文库进行了基因表达水平定量和共表达网络分析,并将所有文库进行分类,总共涉及1176个突变体,1102种处理条件,12个组织和176个发育时期,同时也对突变体和处理条件分别同对应的对照组进行差异表达分析。
wt_a72372020080144336_8cd1a4.jpg

图1: 网页数据集与功能说明(上图),网站首页及部分button说明(下图)

为提高实验人员搜索海量数据的效率,ARS不仅支持基因的搜索,同时还提供文库、项目编号、关键字以及任意不同组合的查询方式。ARS具有快速查找基因表达量、组织特异性、突变体和处理响应的功能,并以多种图表返回搜索结果,同时支持对搜索结果下载。用户可根据自己的需求在搜索前和搜索后对表格结果进行过滤,在画图区域单击获取相应文库的信息。此外,网站部署了online基因组浏览器(IGV),实验人员可更加便捷的查看每个文库的详细比对情况。为便于研究者之间快捷地分享最新搜索结果,ARS提供了网页共享功能,并定期更新文库资源,研究者可通过共享按钮来共享当前结果。
wt_a52382020007144337_94692a.jpgwt_a72372020080144337_97b63d.jpg

图2: 基因表达量结果展示(上图),IGV查看序列比对情况(下图)

南方科技大学生物系翟继先副教授为该论文的通讯作者,课题组研究助理张洪,研究助理张飞,博士研究生于义溟为共同第一作者。生物系郭红卫教授和李博生研究助理教授参与了本研究的部分工作。该研究得到了基金委,广东省创新创业团队,以及深圳市科创委的资助。

来源:bioartplants BioArt植物

原文链接:http://mp.weixin.qq.com/s?__biz=MzU3ODY3MDM0NA==&mid=2247497358&idx=3&sn=4930819acd3247c4780b0454eb15281b&chksm=fd736ce9ca04e5ff1dfd402aa8abfa801b101ca5da572833893921a53923391dc3f0be7af78b&scene=27#wechat_redirect

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

基因 转录组 拟南芥

推荐资讯