Genome Biology:评估聚腺苷酸化位点的新算法

宫奥博 2021-08-17

单细胞RNA-seq(scRNA-seq)能高分辨率地描述基因表达。

2021年8月10日,中国科学院上海营养与健康研究所杨力团队在Genome Biology 上在线发表了题为“SCAPTURE: a deep learning-embedded pipeline thatcaptures polyadenylation information from 3′ tag-based RNA-seq of single cells”的研究论文,该研究开发了一种逐步的计算方法--SCAPTURE,用于识别、评估和量化基于3′标签的scRNA-seq的裂解和聚腺苷酸化位点(PASs)。

单细胞RNA-seq(scRNA-seq)的出现使基因表达分析具有了前所未有的分辨率。主要基于差异基因表达(DGE),scRNA-seq揭示了大量细胞、复杂组织、甚至整个动物的异质性,从而识别了不同的细胞身份和系谱轨迹,尤其是在发育或分化系统中。通过利用基于机器的细胞分离,现在可以单独处理数十万个细胞,进行RNA富集和深度测序分析。

最近,使用oligo(dT)引物生成cDNA并随后从其3′端进行短读测序的scRNA-seq技术(此处称为基于3′标签的scRNA-seq),如inDrops、Drop-seq、Seq-Well和10xChromium,已被广泛采用。与全长scRNA-seq(如Smart-seq2)和典型的细胞RNA-seq(如Illumina TruSeq)相比,这些基于3′标签的scRNA-seq数据的特点是在基因的3′末端有丰富的读取。

例如,用TruSeq、Smart-seq2和10x Chromium对人类PBMCs的转录组分析进行的比较表明,在10x Chromium数据中,无论是蛋白质编码基因还是非编码基因,映射的读数都偏向于注释的裂解和聚腺苷酸化部位(PASs)。相比之下,TruSeq和Smart-seq2的数据以覆盖整个基因体的读数来描述基因表达。因此,基于3′标签的scRNA-seq数据集可以被挖掘出PAS的识别和使用特定PAS的转录物的表达。

该研究开发了一种逐步的计算方法--SCAPTURE,用于识别、评估和量化基于3′标签的scRNA-seq的裂解和聚腺苷酸化位点(PASs)。SCAPTURE在单细胞中以高灵敏度和准确性从头开始检测PASs,从而能够检测到以前未命名的PASs。量化的替代性PAS转录物完善了基因表达以外的细胞身份分析,丰富了从scRNA-seq数据中提取的信息。使用SCAPTURE,研究人员以单细胞分辨率显示了感染者与健康人的PBMCs中PAS使用的变化。

参考消息:

https://genomebiology.biomedcentral.com/articles/10.1186/s13059-021-02437-5

数据 基因 基因位点

推荐资讯