以下文章来源于猫头鹰教室 ,作者特雷西
猫头鹰教室为小张聊科研发布课程与会议信息的专属账号,带来小张聊科研最新课程培训信息,并介绍课程相关的知识点,让您随时可以get到想参加的课程,也为学员提供一个继续学习和交流的港湾
GEO数据库是一个综合性的数据库,里面有海量的数据,包含各种各样疾病的芯片和测序结果,现在GEO数据挖掘的文章也是越来越多了,当然,文章的分数也有高有低。
想发一篇不错的文章,idea很重要,今天分享一篇GEO数据挖掘的文章,看看别人是如何发到4分的。
文章发表在《Journal of Translational Medicine》上, 这个杂志18年IF为4.197。这篇文章通过GEO数据挖掘,试图找到心房颤动相关脑卒中的潜在biomarker和治疗靶点。
文章关键点:从数据库中找到房颤和脑卒中相关数据集,分别用来筛选房颤相关差异基因以及脑卒中相关差异基因,然后取交集,围绕共同的差异基因做后续分析。
作者找到了两个数据集,GSE79768和GSE58294。其中,GSE79768包含房颤病人样本和窦性心律异常样本,用以找到房颤相关差异基因;GSE58294包含脑卒中后不同时间的血液样本以及正常人的血液样本,用来筛选脑卒中相关差异基因。
对于筛选到的差异基因,做了常用的GO、KEGG富集分析,
而对于已知与疾病相关的重要生物学过程所包含的差异基因,挑出来进行聚类分析:
文章中还分别对两组数据集的差异基因做了PPI网络分析,韦恩图展示了房颤差异基因与脑卒中后不同时间差异基因的交集,得到了四个共同的差异基因,这四个差异基因将房颤和脑卒中关联起来。
文章中用到了AmiGO,这个工具可以得到这四个基因相关的GO条目。
这里面还用到一个看起来比较厉害的数据库,CTD,全称是comparative toxicogenomics database,把基因丢进这个数据库,可以找到与该基因相关的疾病以及相关程度,有一个打分。作者把这个四个基因扔进去,寻找其与神经以及心血管疾病的相关性。
最后,文章用mirDIP, miRDB, TargetScan以及DIANA预测作用于上述四个基因的相关miRNA,并分析基因与miRNA之间相关的GO和KEGG条目,用到了Diana-miRPath。
这篇文章的两个数据集都是芯片数据,分析起来并不困难,作者有了思路创新,将两个不同疾病数据集通过共同差异基因关联起来,对房颤相关脑卒中疾病的分子标志物和治疗靶标提供了一些潜在数据。
可见,不错的思路加上不错的生信工具,也可以发一篇不错的文章。