统计学在天文学中有哪些应用?

科技工作者之家 2020-05-11

来源:和乐数学

 

天文学是研究天体和宇宙空间的性质及演化规律的科学,研究内容包括天体的几何结构、运动规律、物理性质、化学组成、能量来源以及演化规律等等。天文学家是怎样从距离遥远的天体上获得这些知识的呢?首先,我们必须能够得到天体的辐射信息,然后才能通过对光谱、时变和能谱等资料的分析,推断其化学成分、质量大小、绕转周期(双星)、辐射机制、以及天体结构等性质。所以,现代天文学研究需要具备三个条件,一是现代天文望远镜技术;二是数理理论;三是适用于计算机的数值方法和统计学方法。所谓统计学,是对观测数据进行收集、归纳、分析,基于某种模型(分布)假设,提取数据的关键信息,揭示数据潜在的变化规律,并作出决策。统计学的优势在于有可能对那些存在不确定性的观测进行决策。

 

古天文学家非常关心观测误差,他们经常比对不同地区的观测误差,并试图分析误差的来源。统计学应用于天文学的历史可以追溯到16世纪,在此,我们做个简要的介绍。


16世纪后期,第谷和伽利略发现通过取不同的观测值的均值可以提高观测精度。伽利略还给出了关于超新星距离的观测误差的初步讨论。


在18世纪中叶,哥廷根的天文台负责人梅耶在分析月球天平动时,创造出一种包含多元线性方程的参量估值的“平均方法”;英国天文学家米歇尔在均匀分布的基础上,使用显著性检验,说明昴星团是一个物理的而非偶然形成的星系团;伯努利和郎伯特提出了最大似然概念,并创立了误差理论。


到了18世纪80年代,当时最著名的法国科学家拉普拉斯和勒让德推广了受约束情况下多元参量方程组的解法,建立了最小二乘法。


19世纪初,高斯创建了误差分布理论,并且把它和拉普拉斯的最小二乘法联系起来。高斯还提出了方差不等测量的误差处理办法,发展了无偏最小方差估计。


二十世纪许多天文研究中都使用了最小二乘法。例如卡普坦基于曲线拟合,推导出恒星光度函数,并由此推断出的银河系结构。哈勃和哈马逊对红移-星等关系做了最小二乘拟合,开创性了星系研究的先河。尽管整个19世纪,人们并不知道什么是高斯分布,而是称之为“天文学的误差函数”,但基于正态误差定律的统计方法在涉及方位天文学和恒星计数的研究中得到了广泛的应用。计算机的发明更是极大地促进了最小二乘估计在天文中的应用。


最大似然估计概念的完善是20世纪由费希尔完成的。而将其应用于天文学又推迟了近半个世纪。利用最大似然法,荣格从赫罗图中得到统计视差;克劳福德等人计算出能谱幂律分布的斜率;林登-拜耳对有流量限制的样本估计了光度函数;露西使模糊图片得以恢复;卡什拟合出了光子计数的参数,不一而足。在星系天文学中,最大似然法在星系流参数估计和星系光度函数计算中也发挥了重要的作用。

 

贝叶斯和拉普拉斯的逆概率、贝叶斯定理在18世纪晚期取得了长足的发展,但一直到20世纪后期才应用于天文学。越来越多的天文学家意识到贝叶斯估计的潜力,特别是在河外天文学和宇宙学领域。他们用贝叶斯方法研究伽马暴、引力波、宇宙学常数、类星体、以及超新星和星系分类等等。用于鉴别恒星和星系的贝叶斯分类器被用来构建大型自动巡天观测星表;最大熵图像恢复也吸引了人们的兴趣。一系列关于“科学与工程中的贝叶斯推理与最大熵方法国际研讨会”在世界各地召开,詹姆斯·伯杰, 威廉·杰弗瑞, 托马斯·拉雷多和阿兰娜·康纳斯等人都为贝叶斯估计在天文学中的应用作了开拓性的工作。

 

非参数或者未知分布的统计推断是在20世纪70年代后发展起来的。1970年,非参数化双样本的克尔莫格罗夫 –斯米尔诺夫拟合优度检验第一次出现,即刻被人们接受和使用。事实上,我们往往不清楚观测量的潜在分布,特别当样本数量很小、无法反复观测的情况下,非参数估计为我们提供了利器。

 

很多时候,统计处理再现了原本模糊的天文图像;统计预测很好地符合了我们的观测和理论预期的模型。因此统计学已成为天文研究不可或缺的工具。但我们须记住,统计推断依赖数据质量和统计假设。有时候,在特定条件下给出的数学简化是合理的,但这并不意味着经过一系列简化之后,最终的推断仍然正确。因此在应用统计学进行推断时,我们须格外小心谨慎。

 

卢瑟福曾经说过“如果你的实验需要做统计学,你就该做个更好的实验”。遗憾的是,天文学家往往无法控制实验。由于天体的距离遥远,观测技术有限,我们得到的数据是有“污染”、不完备而且常常是无法反复观测的。这些“污染”来源于背景噪声、仪器响应以及观测条件、环境的变化。所以进行决策之前,须对数据进行预处理,去除诸如平场、暗场、死时间效应、标定等影响;必要的时候,还要通过平滑等方法降低噪声,然后才能对数据实施统计分析。

 

表  统计决策流程

wt_a52352020011152408_89e6a8.jpg


事实上,把天文科研中的问题转化成一个统计问题常常是困难的。当你阅读一篇科研文献时,你会发现实际的统计工作是那么复杂甚至令人困惑。你会深深地感到书到用时方恨少!

 

《天文学中的概率统计》(陈黎 著. 北京:科学出版社,2020. 04)一书既不是一本统计理论的教材,也不是数值分析的指南,我希望它是天文工作者进行统计分析的参考和帮手。我最大的希望是读者能够建立起统计学家的思维,习惯从统计学的观点来理解参数的精度和模型的选择。在本书的内容安排上,我们尽可能地做到符合逻辑、相对封闭完整,并深入浅出地用天文的实例让读者理解统计学的概念和用法。


wt_a62312020051152408_8c5273.jpgwt_a72312020051152408_8e1279.jpgwt_a62312020051152408_8c5273.jpg


本文摘编自《天文学中的概率统计》(陈黎 著. 北京:科学出版社,2020. 04)一书“第一章 引言”,有删减修改。

 

wt_a72312020051152409_915343.jpg

ISBN 978-7-03-064528-9

责任编辑:胡庆家  范培培



本书比较系统地介绍了天文学中常用的统计方法。全书共分十章,第1章为引言;第2,3章为概率论基础和分布函数;第4章介绍数理统计基础;第5,6章是参数估计和假设检验;第7章为贝叶斯统计;第8章简要介绍了蒙特卡罗方法;第9章为回归分析;最后一章讲述了多元统计中常用的聚类分析、主成分分析和判别分析。


(本文编辑:刘四旦)

本文转自:科学出版社


来源:kelemath 和乐数学

原文链接:https://mp.weixin.qq.com/s?__biz=MzI2NjE0MTY0MA==&mid=2652720320&idx=2&sn=8d4a25d778674adc15e251465ced9750&chksm=f17b4667c60ccf710b9c8f75eee8f81144f328fc3669fcca9a3dbc076bbef738c2ba3d3cdc11#rd

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

天文 统计学 贝叶斯

推荐资讯