重整化群和信息论的关联

科技工作者之家 2021-06-28

导语

因复杂物理系统的分析取决于从众多其他自由度中提取相关自由度的能力。尽管人们对机器学习寄予厚望,但它也带来了可解释性的挑战。研究人员通常不清楚学习到的“相关”特征与物理理论的对应关系。在最近发表在 Physics Review Letters 的一篇文章中,研究人员报告了有助于解决这个问题的理论结果:他们建立了重整化群的场论相关性与信息瓶颈(information bottleneck,IB)理论定义的相关性概念之间的等价性。他们的分析表明,对于由场论描述的统计物理系统,使用IB理论发现的自由度确实对应于具有最低标度维数的算子。他们以数值方式证实了他们的场论预测。研究人员研究了IB算法对物理对称性的依赖性。他们的发现提供了一个连接两个不同理论的方法,以及一个在物理的深度学习应用中能够给出物理可解释性的例子。


20210630020919_fb058c.jpg

研究理论模型是物理研究的一个重要方向。然而,对于复杂的系统,确定正确的自由度是什么,并根据这些自由度构建模型,本身就是一个挑战。这个过程是由实验或数值观察驱动的,但在实践中,物理直觉和先验知识对于构建一个足够简单的模型来描述现象的“本质”至关重要[1]。尽管如此,数据本身应该包含完成这项任务的足够信息。一个方案是使用现代计算方法,特别是深度学习(deep learning)[2-4]。使用该算法的一个基本障碍是物理学概念(主要以场论语言表述)与深度学习的理论和实践之间的不匹配,这就是可解释性问题[5]。为了解决这个问题,需要一个能够兼容这两者的框架。与物理学和计算机科学[6-8]密切相关的信息论(information theory)是一个候选者。

1. 研究背景

在其经典的表述中,信息论不了解信息的内容,专注于其有效传输[9]。尽管通常只有部分信息与问题相关,但事实证明,很难普遍定义“相关性”概念[10],信息瓶颈理论解决了该问题。该理论认为:随机变量中的相关信息由相关性或共享信息定义,具有辅助相关性变量,提供隐式过滤器,用以指示保留哪些内容。

 压缩数据以有效地保留隐式定义的相关内容被视为拉格朗日优化问题,该问题最近引入了深度学习算法[12]。然而,在物理学中,已经存在一个基本的和先验的独立相关概念,它基于在重整化群(renormalization group,RG)流中体现的尺度变换下的算子属性 [13-15]。RG相关性是人们所拥有的最精确的定义,可以确定系统宏观物理特性的可观察量。RG直接连接到共形场论(conformal field theories,CFT)的概念中,彻底改变了人们对临界现象的理解 [16-22]。

 在这里,研究人员表明RG和信息论的概念,实际上在物理系统中是等价的,即信息论意义上的有关长程属性的信息是由最相关的算子确定的。自从观察到其流动的不可逆性以来,RG背景下的信息丢失一直吸引着人们[23-31]。研究人员引入了RG与压缩理论的联系,它是定量的和可计算的。这使研究人员能够以数值方式验证预测。可以证明,使用IB方法可以从数据中提取最相关的算子,以及有关物理对称性的信息和基于表征分布的内在信息理论量,并且无需调用场论对象。因此,该结果不仅具有理论意义,而且具有实践意义。它提供了一种实现理论任务自动化的途径。

 这些结果和深度学习 [32,33] 被用来构建一种有效的算法,即基于神经网络的实空间互信息估计器(real-space mutual information neural estimator,RSMI-NE)[34,35] ],从更大的输入中提取物理上相关的算子,并表征空间相关性、相变(phase transitions)和序参量(order parameters)。研究人员证明RSMI是IB问题的一种情况,这为该数值方法提供了理论基础。

 2. 信息瓶颈理论和实空间互信息估计器

任何数据的相关特征,仅相对于手头的任务有意义地定义,并且它们的识别因数据中可能同时存在的多个“不相关”(针对所提出的问题)结构或规律而变得复杂。信息瓶颈为此类相关特征的无监督学习提供了严格的框架。以“数据”V的联合概率分布和辅助“相关性”变量E作为输入,IB找到V的最佳压缩H,保留有关E的信息。因此,与E的相关性定义了V中的相关内容,而不是任意度量。IB可以表示为以下变分问题:


20210630020920_042a2b.jpg

 

20210630020920_0d965e.jpg

图1:左侧:IB方案的流程图:构建了一个最佳编码器,用于提取有关包含在V中的相关变量E的信息。右侧:IB曲线描绘了相关信息。信息为βI的函数,在转换的临界值产生新的解决方案,具有增加的模数的压缩变量H出现,旧的解决方案成为不稳定最小值。

 研究人员需要定义E以确保IB准确保留RG相关信息。在RSMI[36,37]的背景下,研究人员对实空间RG进行了适当的定义:对于表示粗粒度化的区域中自由度边际分布的随机变量V,变量E(“环境”)是系统在变量V非零厚度壳之外的其余部分。

 

20210630020921_1b6e63.jpg

图2:转换矩阵的设置。对于圆柱的系统,IB方程可以用转换矩阵的特征向量来求解,在大尺度L的限制下,转换矩阵的特征向量与CFT数据有关。

 RSMI算法[36,37]与IB密切相关。具体来说,它还最大化了相关信息。直观地说,IB提取了βI允许的尽可能多的特征,随着βI的增长而添加它们,而RSMI从一开始就精确地优化了H的最佳特征。因此,RSMI是βI趋于无穷大的情况。由此建立的IB和场论之间的定量联系给出了将任一领域的不同理论和数值方法应用于其对应领域的可能性。

 3. 结论

结果具有明确的理论和实践流程:可以完全根据信息理论量来定义和探讨RG意义下的物理相关性,而无需明确提及“算子”、“标度维数”、“场论”等。这些数学对象在信息论方面通常是不可用的——人们可以访问概率分布的样本,但不知道是哪个物理系统生成的,它的相关算子是什么,如何它们用微观自由度表示,或者人们应该计算哪些相关函数。通过形式化和证明物理相关性的信息论概念与RG的等效性,研究人员赋予了它具体的含义,并开发了必要的技术,使其在分析和数值上可量化和可计算。这提供了在面对复杂数据时发现上述问题答案的方法。

 在理论方面,考虑到不依赖哈密顿量的概念,应用IB方法在无序和非平衡系统情况下提取相关量是很有前景的。这可能需要更深入地了解IB方程的性质和它们在RSMI-NE算法中的约束版本。研究人员希望使用物理量的信息论公式,结合深度学习的能力,以受控的方式优化它们的算法[34,35,64],这可以为更多理论上可解释的问题提供解答。

来源: 集智俱乐部

原文链接:http://mp.weixin.qq.com/s?__biz=MzIzMjQyNzQ5MA==&mid=2247567965&idx=1&sn=2da6a91aa258a3b99ad8e7557b633259

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

信息论 相关性分析 ib

推荐资讯