机器学习在空间物理的应用

科技工作者之家 2020-06-30

来源:国家空间科学中心

从上世纪六十年代起,各个国家的航空航天部门(如美国宇航局NASA和欧洲宇航局ESA)就开始利用天基卫星、地基台站不间断的开展太阳磁场监测,截至现今已经积累了海量的太阳监测数据。例如位于太阳同步轨道的日出卫星(Hinode)上搭载的太阳光学望远镜(SOT)平均每年获取约10TB的数据,位于地球同步轨道(GEO)的太阳动力学观测台(SDO卫星)平均每年可获取500TB的数据,而地基先进技术太阳望远镜(DKIST)平均每年可获取10000TB的数据。截至2019年,Hinode和SDO卫星的数据累计已达到3.1PB[1]。

以美国的太阳动力学观测台(SDO卫星)对太阳大气的监测图像为例,如图1所示,从左上至右下分别是多普勒影像观测(Dopplergram)、光球磁场观测(Magnetogram)、光球连续谱观测(Continuum)、三个选定谱线(1700Å、4500Å、1600Å)观测,以及七个选定极紫外波段(304Å、171Å、193Å、211Å、335Å、94Å、131Å)的观测。

wt_a12302200701023742_6c5efd.jpg

图1 SDO卫星对太阳大气的观测(引自NASA)

如此海量的太阳监测数据,并不是重复的、无意义的,且当前多个天地基望远镜对太阳的联合观测之间也存在差异,这是由于天地基望远镜位于不同的观测位置、通过不同的观测技术手段、采用的仪器针对不同的波段敏感等等。

由于太阳具有复杂的磁场结构、经常存在爆发活动,太阳监测图像所包含的太阳特征也是种类繁多的、具有复杂的空间和时间尺度。如图2所示的太阳特征包括太阳黑子(sunspots)、冕洞(coronal hole),太阳爆发活动包括太阳耀斑(solar flares)、日珥爆发(erupting prominences)、日冕物质抛射(coronal mass ejections)。

wt_a82302020070123743_700551.jpg

图2 太阳特征和太阳爆发活动(引自NASA)

随着更多太空探索任务的持续展开和推进,太阳监测数据会持续增多,人力处理显然已经跟不上海量数据的增速。近年来随着理论和算法的飞速发展,机器学习可以更快速的处理复杂、多维度的数据,去除噪声、自动识别关键信息,正适合于处理海量的太阳监测数据、自主的挖掘数据特征。

在此背景下,Armstrong等(2019)将机器学习方法引入海量Hα太阳监测图像的处理,利用卷积神经网络(CNN)建立大尺度太阳特征的分类模型,并通过“转移学习”算法(transfer learning),研究该模型是否也可以从其他卫星、其他波段、不同分辨率的图像观测对太阳特征进行分类。

首先,他们利用13175张Hinode卫星SOT观测的Hα(6563Å)图像,手动建立了分类数据库(大容量标识数据库),将图像上的太阳特征分类为暗条、耀斑亮带、日珥、太阳黑子、以及平静太阳(没有前面四个太阳特征的区域)。

wt_a62302020071023743_72c62f.jpg

图3 太阳特征分类模型将日珥图像分类为日珥的过程示意图(引自1)

这里需要指出的是,大容量标识数据库由科学家手动完成标注,在此过程中投入大量的时间和精力,这是由于该数据库是深入研究太阳特征和开展建模预报的基础,是非常必要且重要的。在这里向建立空间天气事件和特征数据库的科学家们致敬!

其次,基于这个数据库,他们利用卷积神经网络建立分类模型,将太阳监测图像分类为五个分类(暗条、耀斑亮带、日珥、太阳黑子、以及平静太阳)之一。需要指出的是,暗条和日珥是同类的物质结构、分布在日面上的不同部位,因此图像特征差异很大,因此分开作为两类特征。

他们利用验证集评估模型的分类效果,在1318张图像中,只有一张图像分类错误,准确率高达99.82%。图4是成功分类的太阳特征示意图,从左至右分别是耀斑亮带、日珥、日珥和太阳黑子[1]。

wt_a32302020701023743_76ccf2.jpg

图4 成功分类的太阳特征示意图(引自1)

最后,他们将已建成的网络应用于SDO卫星的太阳监测图像,包括尝试从选定谱线(1700Å、1600Å)观测图像识别太阳黑子、从极紫外波段(304 Å)观测图像识别日珥。

然而结果显示,模型无法在SDO卫星的太阳监测图像上取得同样好的效果,出现了一些将太阳特征误分类的情况。这是由于不同波段的太阳监测图像虽然反映的是同一个太阳特征,但在不同的温度、高度上,其体现出来的“图像特性”是不同的。

图5是该模型移植学习后,误将SDO卫星图像观测(左图)中的太阳黑子分类为耀斑亮带,而同一时刻Hinode卫星SOT图像观测(中图)被正确的分类为太阳黑子,将SOT图像观测降低分辨率后(右图)仍然能正确分类。由此可见,分辨率对模型预报的效果影响不大。

wt_a52372020001023743_79c939.jpg

图5 模型移植学习网络后误将太阳黑子识别为耀斑亮带(引自1)

总之,利用机器学习对太阳监测数据开展太阳特征的识别和分类,是海量的观测数据带来的契机和未来的趋势。Armstrong等(2019)的成功尝试(准确率高达99.82%),也证实了其可行性。

来源:nssc1958 国家空间科学中心

原文链接:https://mp.weixin.qq.com/s?__biz=MzA3NzgzODUwNA==&mid=2653480753&idx=1&sn=5c121788cba483aaa9e039d662f7c774&chksm=8497a6f6b3e02fe098da543469cf6d501f16f49fe6cb13a8e36807e5bcaf52f23be2b79e8552#rd

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

太阳 数据库 空间数据

推荐资讯