超算发力 新毫秒脉冲星“现身”

科技工作者之家 02月29日

科技日报记者 王延斌

2月28日,科技日报记者从齐鲁工业大学国家超级计算济南中心(以下简称济南超算)了解到,该中心与齐鲁师范学院组成的科研团队借助500米口径球面射电望远镜(FAST)合作发现一颗新的毫秒脉冲星,并被命名为“PSR J1810-0622”。中国科学院国家天文台FAST首席科学家李菂表示,该毫秒脉冲星自转周期为4.55毫秒,根据银河系电子密度模型估算,这颗脉冲星距离地球约678光年。

该项研究由济南超算FAST联合研究中心科研团队在山河超级计算平台上计算筛选,是国家天文台-齐鲁师范学院-济南超算联合研究团队的首个重大成果,同时也是FAST基于山东省完全自有科研资源发现的首颗毫秒脉冲星。

十亿年慢一秒,可媲美“地球上最好的钟”

“脉冲星的旋转特别稳定,可以做到十亿年慢一秒,可以媲美地球上最好的钟。有了时间,可以锚定很多基本的物理测量量,来研究宇宙的一系列基本的性质。”李菂说。

毫秒脉冲星,是自转周期在 1—10毫秒范围内的脉冲星,它仅能在微波或X射线的电磁波频谱上被观察到。

脉冲星被称为20世纪60年代的四大发现之一,是一种快速旋转的中子星,源于8—25倍太阳质量的恒星演化到末期经历超新星爆发而形成。脉冲星中心的物质大约是一个太阳质量塌缩成中子星,其物质密度大约是水的密度千万亿倍。

齐鲁师范学院物理与电子工程学院院长张洁向记者表示,脉冲星的辐射来自其强大磁场的极冠区,每当中子星极冠转到地球视线方向,人类便看到其辐射信号。通过观测脉冲星的辐射信号,可以探测银河系中星际介质的分布和密度以及银河系的磁场分布与强度。此外,科学家们也在探索将脉冲星用于建立标准时间系统、检验爱因斯坦广义相对论和探测低频引力波信号等。在不到20年的时间里,脉冲星领域在1974年与1993年接连两次获得“诺贝尔物理学奖”。

研究脉冲星,其广义意义在于帮助拓展现代物理学理论研究,对空天信息和太空导航有重要的应用前景,但此次发现的脉冲星,还需科学家后续研究才能界定其科学意义。

在浩渺的宇宙中搜寻脉冲星并非易事。

专家表示,中国天眼FAST夜以继日地巡视着浩瀚星空,每秒接收到的宇宙电磁信号数据规模约为1.6GB,一天的数据量高达144TB,而每年则新产生约20PB的数据量,脉冲星的微弱信号便隐藏其中。传统搜寻方法要求科研人员首先需要对这些数据进行消色散、匹配滤波等处理后,生成脉冲星候选体数据结果图,再通过肉眼辨识出隐藏在其中的真实脉冲星信号。而这样的传统搜寻算法存储吞吐和计算规模很大,得到的候选体数量庞大,搜寻效率相对较低。

在国家超级计算济南中心研究员郭猛看来,现在虽然有国外开发脉冲星候选体辅助预筛选软件,但面对如此庞大数据量,这类软件也难以实时生成脉冲星候选体,同时对算力需求的急剧增加。

“举例来说,上述软件利用最常见的粗浅搜寻方法处理单个观测数据文件需要近几十个小时;若要进行更精细搜索,那么所需时间将会成倍增加,且得到的候选体数量也有成千上万个。”郭猛表示,如何有效地提高脉冲星数据筛选的速度和效率,使科研人员更快找到真正的脉冲星信号,极具挑战性。

FAST每年搜寻近20PB数据,天文问题变成了计算问题

记者了解到,济南超算科研团队介入上述任务的关键一步,便是依托其卓越的计算和存储能力,对符合脉冲星特征的数据进行优化提取。

“将现有的脉冲星候选体辅助预筛选软件移植在我们的山河超级计算平台上,进行算法改进和并行优化,充分利用多个处理器核心进行并行计算来提高筛选效率,通过数据并行的方式将不同计算节点上的数据进行并行读取和处理,提高整体计算吞吐量。”郭猛表示,“新算法相比该软件传统算法提速22倍,大大提升了探测到脉冲星的效率。”

同时,该团队还将目标识别、图像分类等AI算法与天文射电信号处理知识相结合,通过对AI模型的一系列深度学习训练,辅助筛选脉冲星候选体信息,大大降低依赖人眼大量识图的数量。

据介绍,该团队还创新性研究开发了FAST脉冲星及快速射电暴筛图平台,并正在筹建国际领先的脉冲星数据库。该筛图平台解决了FAST脉冲星及快速射电暴在线筛选、候选体认证的存储和归档问题,实现了FAST信号图在线筛选、候选体存储、认证、归档管理。与传统筛选流程相比,该平台在web上即可登录使用,增加了更多用户交互,实现了多人筛选投票,提高了筛选正确率,降低了脉冲星的筛选流程繁琐程度,且系统提供数据统计分析功能,无需人工再进行繁琐的数据分析统计工作。

利用FAST脉冲星及快速射电暴筛图平台,济南超算对“中国天眼FAST多科学目标同时扫描巡天项目(CRAFTS)”脉冲星做认证的后随格网观测的约500TB存档数据,利用AI算法对产生的海量图片进行智能筛选,历经一年的攻关,最终找到219个候选体,并在这些候选体中首个认证了这颗新脉冲星PSR J1810-0622。

“FAST一年的搜寻数据量可以达到10到20个PB,对这些数据进行有效处理已经从纯粹的天文问题变成了计算机问题,更多地依赖计算和存储能力以及算法的改进。”国家天文台博士后张蕾说。要从如此海量的数据中筛选分析出脉冲星的痕迹,依赖的是高速计算系统。而济南超算被誉为黄河流域“最强大脑”的美誉,它数据储存量大、算力高,为千行百业提供强大的算力支撑作用。