责编 | 兮
近年来生物技术的进展,特别是先进显微成像技术【1,2】和新型蛋白探针的开发 【3,4】,使得科学家们以前所未有的时空精度与广度测量亚细胞尺度的大脑活动,并将研究对象扩展至非神经元细胞如胶质细胞和新型脑活动信号如多巴胺和肾上腺素。然而,随之而来的大量而又复杂的数据带来了巨大的分析与理解这些数据的挑战。很显然,手动标注这些数据费时费力、容易忽略重要信息并且引进操作人员的偏见。同时,因为这些新型数据普遍出现活动地点不固定、活动区域大小不统一、信号在细胞内和细胞间传播等现象,现有的工具 (如为分析神经元钙信号所设计的)无法准确刻画这些复杂的新型数据。因此,开发一套自动、准确、易使用、能描述复杂活动模式的数据分析技术是实验脑科学家们期盼实现的重大突破。
2019年9月30日,弗吉尼亚理工大学(Virginia Tech)于国强课题组和加州大学旧金山分校(UCSF)Poskanzer课题组(共同一作为于国强课题组博士研究生王亦之和Poskanzer课题组成员Nicole V. DelRosso)在Nature Neuroscience杂志发表了题为Accurate quantification of astrocyte and neurotransmitter fluorescence dynamics for single-cell and population-level physiology的研究论文。文章提出了事件分解的新概念,应用概率统计、机器学习和计算优化的理论设计出新的数据分析算法,并开发出一套用户使用方便、功能齐全的软件工具。计算机仿真显示该技术克服了现有技术固有缺陷,大幅提高了分析准确度;作者以小鼠大脑星型胶质细胞钙信号活动为示例,展示出该技术可以分析体外(ex vivo)和在体(in vivo)双光子显微成像动态数据,并揭示出新的生物现象;同时,作者还展示了该技术在谷氨酸、γ-氨基丁酸、肾上腺素等新兴神经信号数据上的应用。该研究以数据驱动和机器学习为算法设计原则,使开发出的技术可以比较容易的应用于各种各样的模式动物、蛋白探针、试验模式、成像解析度与速度,单细胞或细胞群,为科技学家充分利用来之不易的数据提供了新策略。
该技术的核心是将原始视频数据分解为一个个互不交叠的事件(event)(图1)。通过将一个事件数学上定义为在一定连续空间区域内一致动态变化的统一时空分割,作者利用一系列的人工智能和统计学习技术联合估计最能解释数据的模型参数。绝大多数传统的分析显微视频活动数据的方法基于ROI(感兴趣区域)框架,而该框架的一个隐含假设是一个感兴趣区域内所有像素点都应遵从同一个动态过程。这样的设定是无法描述活动地点不固定、活动区域大小不统一、信号在细胞内和细胞间传播等现象的。作者设计的基于事件分解的分析框架巧妙的解决了这些问题,因为每一个事件有它的空间和时间特性共同确定,同一个像素可以在不同的时刻参与不同的事件。一旦事件分解完成,每个事件可以提取若干特征(图2),譬如所占区域大小及形状、动态曲线的上升与下降速度、事件发源地、信号传播路径与速度等。多个事件又可以进一步联合起来提取系统级特征,如事件的空间与时间频域等。
图1:原始视频数据被分解为一个个互不交叠的事件。第一行展示原始数据,第二行展示分解出的事件,一种颜色标识一个事件。
进一步,作者执行软件工程,做出了供实验神经科学家直接使用的程序,公开所有程序源码。该程序可以在GitHub免费无限制下载。界面拷屏如图3。下载网址为https://github.com/yu-lab-vt/AQuA。该程序提供了丰富的用户交互功能,用户通过界面操作可以进行可视化、调整分析结果,并提供了融合其他信息的功能,譬如可以同时使用细胞的形态信息。
最后,作者把开发出来工具在真实的数据上进行测试,发现了许多以前人们没有注意到的现象。测试的数据包括体外单细胞,在体多细胞,钙离子、谷氨酸、γ-氨基丁酸、肾上腺素等脑信号。值得一提的是,虽然产生这些数据的技术已经存在若干年,但新的分析这些数据的技术的出现才使得这些现象的发现得以可能。图4是一个例子,新的分析工具揭示了星型胶质细胞钙离子信号的传播受解刨结构约束,具有方向性。图4:新的分析工具揭示了星型胶质细胞钙离子信号的传播受解刨结构约束,具有方向性。
脑科学的进展深刻的影响了人工智能与机器学习领域的发展,反过来,本论文的研究团队利于人工智能与机器学习的理论研发出新型分析脑科学大数据的技术,助力脑科学的发展。本工作不同于之前存在的脑活动显微成像数据分析工具,可以准确描述与量化复杂的活动模式,为脑科学家们充分利用最新测量脑活动技术进展,进一步研究脑的机制提供了强大的工具。题外话,本工作所处的机器学习与脑科学交叉领域是一个新兴的领域,随着近年世界各国脑计划的大力投入,在可以预见的将来,新的更强大的生物技术将会源源不断的被开发出来,产生越来越多越来越复杂的数据,为从事脑数据分析行业的学者提供丰富的需求与机会。正处在职业早期的年轻学生或教师不妨探索一下这个领域。
于国强博士,美国弗吉尼亚理工大学(Virginia Tech)终身副教授,美国NSF CAREER奖获得者。课题组主要研究方向为脑科学数据分析,主要数据类型为显微成像和单细胞测序,以机器学习理论研究和实用软件工具开发为两分支,互为依托。除正在报道的本工作外,该课题组以第一作者单位近三年内发表如下三项代表性工作:1、2019年12月将在机器学习顶级会议NeurIPS上发表题为muSSP: Efficient Min-cost Flow Algorithm for Multi-object Tracking的研究成果。该算法极大的提高视频数据中物体跟踪的计算效率,比现有的最好算法提高10到1000倍,而物体跟踪的准确性没有任何损失。2、2019年9月,Bioinformatics杂志接收题为SynQuant: An Automatic Tool to Quantify Synapses from Microscopy Images的文章。研究者为检测与量化显微成像中的神经突触开发了自动的分析工具。该研究基于非常简单的阈值法,关键之处在于利用统计学中序理论指导了自适应地设定阈值。该工作有望为其它基于阈值的算法提供启发与借鉴。3、2016年12月在机器学习顶级会议NeurIPS上发表题为Graphical Time Warping for Joint Alignment of Multiple Curves的研究成果。该研究成果的把传统的只能匹配一对曲线的算法Dynamic Time Warping (DTW)推广到任意对曲线的联合匹配,而同时保持了传统算法速度快和保证全局最优的优点。
https://doi.org/10.1038/s41593-019-0492-2
1. Jingtao Fan, Jinli Suo, Jiamin Wu, Hao Xie, Yibing Shen, Feng Chen, Guijin Wang, Liangcai Cao, Guofan Jin, Quansheng He, Tianfu Li, Guoming Luan, Lingjie Kong, Zhenrong Zheng, Qionghai Dai, “Video-rate imaging of biological dynamics at centimetre scale and micrometre resolution”, Nature Photonics, 2019/7/8. 2. Misha B Ahrens, Michael B Orger, Drew N Robson, Jennifer M Li & Philipp J Keller, “Whole-brain functional imaging at cellular resolution using light-sheet microscopy”, Nature Methods, 2013 3. Tommaso Patriarchi, Jounhong Ryan Cho, Katharina Merten, Mark W. Howe, Aaron Marley, Wei-Hong Xiong, Robert W. Folk, Gerard Joey Broussard, Ruqiang Liang, Min Jee Jang, Haining Zhong, Daniel Dombeck, Mark von Zastrow, Axel Nimmerjahn, Viviana Gradinaru, John T. Williams, Lin Tian, “Ultrafast neuronal imaging of dopamine dynamics with designed genetically encoded sensors”, Science, 29 Jun 2018.4. Miao Jing, Peng Zhang, Guangfu Wang, Jiesi Feng, Lukas Mesik, Jianzhi Zeng, Huoqing Jiang, Shaohua Wang, Jess C Looby, Nick A Guagliardo, Linda W Langma, Ju Lu, Yi Zuo, David A Talmage, Lorna W Role, Paula Q Barrett, Li I Zhang, Minmin Luo, Yan Song, J Julius Zhu, Yulong Li, “A genetically encoded fluorescent acetylcholine indicator for in vitro and in vivo studies”, Nature biotechnology, 2018/84. Congchao Wang, Yizhi Wang, Yinxue Wang, Chiung-Ting Wu, Guoqiang Yu*, “muSSP: Efficient Min-cost Flow Algorithm for Multi-object Tracking”, Advances in Neural Information Processing Systems (NeurIPS’19), in press, 2019. (*corresponding author).5. Yizhi Wang, Congchao Wang, Petter Ranefall, Gerard Joey Broussard, Yinxue Wang, Guilai Shi, Boyu Lyu, Yue Wang, Lin Tian, Guoqiang Yu*, “SynQuant: An Automatic Tool to Quantify Synapses from Microscopy Images”, Bioinformatics, accepted, 2019. (*corresponding author). 6. Yizhi Wang, David J. Miller, Kira Poskanzer, Yue Wang, Lin Tian, Guoqiang Yu*, “Graphical Time Warping for Joint Alignment of Multiple Curves”, Advances in Neural Information Processing Systems (NIPS’16), 3648-3656, December, 2016 (*corresponding author).