大统一理论

科技工作者之家 2020-11-17

大统一理论(grand unified theories,GUTs),简称GUT,又称为万物之理,由于微观粒子之间仅存在四种相互作用力,万有引力、电磁力、强相互作用力、弱相互作用力。理论上宇宙间所有现象都可以用这四种作用力来解释。通过进一步研究四种作用力之间联系与统一,寻找能统一说明四种相互作用力的理论或模型称为大统一理论。

这一理论最初源于电磁的研究,麦克斯韦研究证明它们是电磁现象的同一种基本相互作用的两个方面,可以用同一组方程式加以描述。到20世纪中叶前,这一描述又改进到包括了量子力学效应,并以量子电动力学(QED)形式出现。

需要指出,统一理论尚未得到最后验证,而且霍金在《时间简史》中也指出,也许会发现大统一理论。但这个大统一理论并不是爱因斯坦最初想的大统一理论,因为不可能通过一个简单美妙的公式来描述和预测宇宙中的每一件事情,毕竟宇宙是确定性和不确定性相互统一。

研究背景早在20世纪20年代,著名物理学家爱因斯坦就致力于寻找一种统一的理论来解释所有相互作用,也可以说是解释一切物理现象,因为他认为自然科学中“统一”的概念或许是一个最基本的法则。甚至可说在爱因斯坦的哲学中,“统一”的概念根深蒂固,他深信“自然界应当满足简单性原则”。

从30年代提出相对论后不久,爱因斯坦就着手研究“大统一理论”,试图通过“弱作用,磁场,强作用”的统一思维来简单的解释宇宙,进一步将当时已发现的四种相互作用统一到一个理论框架下,从而找到这四种相互作用产生的根源。这一工作一直到他1955年逝世为止,并几乎耗尽了他后半生的精力,而且统一思维与当时物理学界的主流思想不符,以致于一些科学史学家断言这是爱因斯坦的一大失误。

研究过程弱电统一理论

60年代格拉肖、温柏格、萨拉姆三位科学家提出弱电统一理论,把弱相互作用和电磁相互作用统一起来,这种统一理论可以分别解释弱相互作用和电磁相互作用的各种现象,并预言了几种新的粒子,他们因此荣获1979年诺贝尔物理学奖,1983年实验发现了理论中预言的粒子,进一步证明了理论的正确性。

1973年,美国科学家帕提(Jogesh Pati,1937- )和萨拉姆提出了统一描述夸克和轻子的帕提-萨拉姆模型,预言了质子的衰变。

自然界一共有4种相互作用,除了引力相互作用和电磁相互作用外,还有强相互作用和弱相互作用。这4种相互作用强度大小和作用范围都相差悬殊,也大相径庭。例如,引力的强度只有强相互作用力的100万亿亿亿亿分之一,引力的作用范围却非常大,从理论上说可以一直延伸到无限远的地方,引力是长程力;而强相互作用力的范围却很小很小,只有1厘米的10万亿分之一,说强相互作用力是短程力;弱相互作用力也是短程力,力程不到1厘米的1000万亿分之一,强度是强相互作用力的1万亿分之一;电磁力与引力一样是长程力,但它的强度要比引力大得多,是强相互作用力的1/137。4种相互作用在性质上看来有明显的差异,然而科学家们却在思索:自然界为什么有这4种相互作用?这4种相互作用是否只有差异而无共同之处?这4种相互作用能不能在一定条件下得到统一的说明?从科学史来看,第一个认真思索并付诸行动的是物理学家爱因斯坦。爱因斯坦在完成广义相对论的理论建设后,就一直在考虑能不能把引力相互作用和电磁相互作用统一起来。

统一引力和电磁力几乎成了爱因斯坦中老年时期所要攻克的主要目标,然而遗憾的是爱因斯坦终究没有完成这一伟大的工程。自幼就崇敬爱因斯坦的温伯格十分赞赏统一思想。但是既然引力和电磁力的统一障碍重重,那能不能先统一其他相互作用呢?从60年代起,温伯格就着手弱相互作用与电磁相互作用的统一。统一之路并不平坦,温伯格甚至不清楚该从哪里入手。从50年代末到60年代,在基本粒子理论领域里,对称性自发破缺理论获得了较大的发展。例如,李政道和杨振宁在1956年就已发现弱相互作用里的一种破缺对称性(即破缺手征对称性)。所谓对称性自发破缺理论,通俗地说,它认为一些不同的现象或规律可追溯到同一源头,最初有着共同的对称性,后来由于种种原因对称性被自发地破坏,这样我们就可以从对称性来研究它们的共性,从对称性自发破缺机制来研究它们的特殊性。1965年起温伯格也开始了关于对称性自发破缺理论的研究,并渐渐意识到这将是通向相互作用统一理论的合适道路。1967年秋,温伯格终于确定弱相互作用和电磁相互作用可根据严格的、但自发破缺的规范对称性的思想进行统一的表达。他的理论结果发表在这一年的《物理评论快报》上,题目是“一个轻子的模型”。

这是科学上第一个成功的相互作用统一理论。理论中所预言的中间玻色子W和Z,在1983年被欧洲核子研究中心找到。弱电统一理论的成功,肯定了相互作用统一思想的正确性,促使许多科学家进一步去研究把强相互作用、弱相互作用和电磁相互作用统一在一起的大统一理论,以及把引力相互作用也统一进去的巨统一理论。

强、弱、电磁三种作用统一理论

70年代中期,人们进一步提出强、弱、电磁三种作用统一的大统一理论。大统一理论的结论之一是预言质子要衰变,这与实验结果有矛盾。

引力在其中的关系

将引力统一到这一图像中之所以如此困难,这是因为引力与其他三种自然力相比极其微弱。不过,在某种意义下,引力和电磁力同样简单和易于处理,因为它只要求一种传达粒子,即无质量的引力子。

约翰"马隆著《科学难解之谜》中的一段话说得非常清楚:“在基本粒子层面,引力基本不起作用。一个电子和的一个质子组成的氢原子,靠的不是引力,而是强度更大的电磁力。到底多大呢?大10^40倍。正如法国物理学家和作家蒂阿纳所说:‘如果没有电磁力,仅仅在引力的作用下的话,1个氢原子就将充满整个世界。引力非常微弱,不可能使电子和质子结合的如此紧密.......除非能将引力与其他三种力统一起来,否则就不会存在‘万物理论’,或者大统一理论这类的现代科学的圣杯。

将引力包括到TOE中的困难,可以通过考察四种基本力如何从一种统一的相互作用中‘分裂’出来而得到了解,物理学家认为这种‘分裂’应发生在宇宙由大爆炸中刚产生之时。光子与中介矢量玻色子和胶子的本质差别之一,是光子没有质量,其他粒子却有质量。光子因没有质量而容易被创造,且能够(原则上)在整个宇宙范围内传播。传达弱力和强力的玻色子则做不到这点。在一次相互作用中,‘创造’特定玻色子组所需要的质量是按照量子力学的测不准原理向真空借来的。但测不准原理指出,这些所谓的‘虚’粒子能够不时出现和随即消失,条件是它们不能存活过久以避免被宇宙‘注意’到它们的存在。这样一个粒子的质量越大,它在短暂生存期需要借用的能量越多,它也就必须越快地偿还债务。这就限制了玻色子在完成任务并消失之前运动所及的范围。

局限在原子核内部的短程粒子

但是,当宇宙很年轻时,它浸泡在原始火球的能量大海之中。只要这一能量的密度足够高,即使是胶子和中介矢量玻色子也能从火球抽取足够能量而变成真实的粒子,并在火球中到处游荡。那时,它们真正与光子等效,而不仅仅是类似;所有基本相互作用也都是同样强和远程的作用。随着宇宙膨胀和冷却,它们逐步失去部分能耐,变成了我们看到的局限在原子核内部的短程粒子。

在这幅图像中,引力仍然独树一帜。根据最好理论,当作为整体的宇宙温度为时,引力与所有其他力一样强。 当宇宙开始平缓膨胀和冷却时,其他三种力仍然是统一的。在开始之后秒、温度达到时,宇宙冷却到不能供养强力的载体,于是强力被局限在我们所见的距离以内。到秒时,温度为,宇宙冷却到无法维持中介矢量玻色子,于是弱力也变成了短程力。这是在整个宇宙的温度与地球上的粒子加速器迄今达到的最高能量相当的时期发生的——弱电理论之所以比QCD远为坚实可靠,这就是原因之一(因为能够与实验进行比较)。

由上述图像不难看出将引力包括到统一理论中的困难所在。然而有趣的是,还在发现强和弱两类相互作用之前,引力就已经与电磁力包括到一个统一理论中了!对统一理论的这一探讨,在两种‘附加’力发现之后很多年内基本上被人遗忘,而它算得上是长期追求万物之理征途上的领跑人1。

卡鲁扎-克莱因理论

广义相对论用的曲率来描述引力。阿尔伯特·爱因斯坦提出这一概念后不久,就发现用与爱因斯坦广义相对论方程式等效的方程式来描述五维曲率时,就得到我们熟知的、与麦克斯韦电磁场方程式并列的爱因斯坦理论中的场方程式。几年以后的1920年代,引力和电磁场这种五维形式的统一甚至推广到包括了量子效应,这就是后来以两位开创此项研究的先驱科学家姓氏命名的卡鲁扎-克莱因理论。

计算中涉及增加额外维度的所有理论都叫做卡鲁扎-克莱因理论,但这种处理方法长期无人采用,因为,要把卡鲁扎-克莱因理论最初获得成功后就发现了的更复杂的弱和强相互作用效应包括进来,它要求的就不是一个而是好几个‘额外’维度。如果说光子是第五维度中的涟漪,那么(粗略地说)Z粒子就可以看成是第六维度中的涟漪,等等。

有两个原因使这类理论在1980年代再次流行。第一,构建大统一理论的尝试复杂到了令人厌烦的程度,其中有一些看来无论如何也必须增加额外维度才能进行下去。既然总归需要很多额外维度,为什么不用卡鲁扎-克莱因的办法呢?第二,数学物理学家开始对弦理论感兴趣,在弦理论看来,人们习惯视为点状粒子的实体可描述成一维‘弦’的细小片断(远远小于质子)。弦理论也只有在很多维度下才能‘工作’,它给我们极为丰厚的回报——引力。

理论家们以推导各种描述这类多维弦相互作用的方程式自娱,他们发现有些方程式描述的封闭弦环正好具有引力描述所要求的性质——弦环实际上就是引力子。

弦理论

弦理论(string theory)是理论物理学上的一门学说。弦论的一个基本观点就是,自然界的基本单元不是电子、光子、中微子和夸克之类的粒子。这些看起来像粒子的东西实际上都是很小很小的弦的闭合圈(称为闭合弦或闭弦),闭弦的不同振动和运动就产生出各种不同的基本粒子。弦论是最有希望将自然界的基本粒子和四种相互作用力统一起来的理论。

超弦理论

超弦理论、M理论和黑洞物理学

超弦理论是物理学家追求统一理论的最自然的结果。爱因斯坦建立相对论之后自然地想到要统一当时公知的两种相互作用--万有引力和电磁力。他花费了后半生近40年的主要精力去寻求和建立一个统一理论,但没有成功。回过头来看历史,爱因斯坦的失败并不奇怪。实际上自然界还存在另外两种相互作用力--弱力和强力。已经知道,自然界中总共4种相互作用力除有引力之外的3种都可有量子理论来描述,电磁、弱和强相互作用力的形成是用假设相互交换“量子”来解释的。但是,引力的形成完全是另一回事,爱因斯坦的广义相对论是用物质影响空间的几何性质来解释引力的。在这一图像中,弥漫在空间中的物质使空间弯曲了,而弯曲的空间决定粒子的运动。人们也可以模仿解释电磁力的方法来解释引力,这时物质交换的“量子”称为引力子,但这一尝试却遇到了原则上的困难--量子化后的广义相对论是不可重整的,因此,量子化和广义相对论是相互不自洽的。

超弦理论最引人注目,它距完成超对称统一理论还相当遥远。粒子理论的一个重要探索方向是关于超对称统一理论的研究,其目标一是把大统一理论扩大到包括万有引力在内,从而把四种基本相互作用统一到一起来;二是探索夸克和轻子的内部结构,提出“亚夸克”模型,从而把自旋为半整数的费米子和自旋为整数的玻色子统一到一起。

超弦理论是人们抛弃了基本粒子是点粒子的假设而代之以基本粒子是一维弦的假设而建立起来的自洽的理论,自然界中的各种不同粒子都是一维弦的不同振动模式。与以往量子场论和规范理论不同的是,超弦理论要求引力存在,也要求规范原理和超对称。毫无疑问,将引力和其他由规范场引起的相互作用力自然地统一起来是超弦理论最吸引人的特点之一。因此,从1984年底开始,当人们认识到超弦理论可以给出一个包容标准模型的统一理论之后,一大批才华横溢的年轻人自然地投身到超弦理论的研究中去了。

研究发现在十维空间中,实际上有5种自洽的超弦理论,它们分别是两个IIA和IIB,一个规范为Apin(32)/Z2的杂化弦理论,一个规范群为E8×E8的杂化弦理论和一个规范为SO(32)的I型弦理论。对一个统一理论来说,5种可能性还是稍嫌多了一些。因此,过去一直有一些从更一般的理论导出这些超弦理论的尝试,但直到1995年人们才得到一个比较完美的关于这5种超弦理论统一的图像。

场基本理论极限

所有的五种超弦理论和M理论都是一个场基本的理论的不同极限。存在一个唯一的理论,姑且称其为M理论。M理论有一个很大的模空间(各种可能的真空构成的空间)。5种已知的超弦理论和十一维超引力都是M理论的某些极限区域或是模空间的边界点(图中的尖点)。有关超弦对偶性的研究告诉我们,没有模空间中的哪一区域是有别于其他区域而显得更为重要和基本的,每一区域都仅仅是能较好地描述M理论的一部分性质。但是,在将这些不同的描述自洽地柔合起来的过程中我闪也学到了对偶性和M理论的许多奇妙性质,尤其是各种D-膜相互转换的性质。

在此我们不得不提到超弦理论成功地解释了黑洞的熵和辐射,这是第一次从微观理论出发,利用统计物理和量子力学的基本原理,严格了导出了宏观物体黑洞的熵和辐射公式,毫无疑问地确立了超弦理论是一个关于引力和其他相互作用力的正确理论

将5种超弦理论和十一维超引力统一到M理论无疑是成功的,但同是也向人们提出了更大的挑战。M理论在提出时并没有一个严格的数学表述,因此寻找M理论的数学表述和仔细研究M理论的性质就成了这一时期理论物理研究热点。

道格拉斯(Douglas,MR)等人仔细研究了D-膜的性质,发现了在极短距离下,D-膜间的相互作用可以完全由规范理论来描述,这些相互作用也包括引力相互作用。因此,极短距离下的引力相互作用实际上是规范理论的量子效应。基于这些结果,班克(Banks,T)等人提出了用零维D-膜(也称点D-膜)作为基本自由度的M理论的一种基本表述--矩阵理论。

矩阵理论是M理论的非微扰的拉氏量表述,这一表述要求选取光锥坐标系和真空背景至少有6个渐近平坦的方向。利用这一表述已经证明了许多偶性猜测,得到了一类新的没有引力相互作用的具有洛仑兹不变的理论。如果我们将注意力放在能量为1/N量级的态(N为矩阵的行数或列数),在N趋于无穷大的极限下,可以导出一类通常的规范场理论。许多迹象表明,在大N极限下,理论将变得更简单,许多有限N下的自由度将不与物理的自由度耦合,因而可以完全忽略。所有这些结论都是在光锥坐标系和有限N下得到的,可以预期一个明显洛仑兹不变的表述将是研究上述问题极有力的工具。具体来说,人们期望在如下问题的研究上取得进展:

(1)全同粒子的统计规范对称性应从一个更大的连续的规范对称性导出。

(2)时空的存在应与超对称理论中玻色子和费米子贡献相消相关联。

(3)当我们紧致化更多维数时,理论中将出现更多的自由度,如何从量子场论的观点理解这一奇怪的性质?

(4)有效引力理论的短距离(紫外)发散实际上是某些略去的自由度的红外发散,这些自由度对应于延伸在两粒子间的一维D-膜,从场论的观点来看,这此自由度的性质是非常奇怪的。

(5)将M理论与宇宙学联系起来1。

矩阵理论

显然,没有太多的理由认为矩阵理论是M理论的一个完美的表述。值得注意的是矩阵理论的确给出了许多有意义的结果,因此也必定有其物理上合理的成分,这很像本世纪初量子力学完全建立前的时期(那时,普良克提出能量量子导出黑体辐射公式,玻尔提出轨道量子化给出氢原子光谱),一些有关一个全新理论的迹象和物理内涵已经被人们发现了。但是,我们离真正建立一个完美自洽M理论还相距甚远,因此有必要从超弦理论出发更多更深地发掘其内涵。在这方面,超弦理论的研究又有了新的突破。

1997年底,马尔达塞纳(Maldacena)基于D-膜的近视界几何的研究发现,紧化在AdS5×S5上的IIB型超弦理论与大NSU(N)超对称规范理论是对偶的,有望解决强耦合规范场论方面一些基本问题如夸克禁闭和手征对称破缺。早在70年代,特胡夫特(´tHooft)就提出:在大N情况下,规范场论中的平面费曼图将给出主要贡献,从这一结论出发,波利考夫(Polyakov)早就猜测大N规范场论可以用(非临界)弦理论来描述,马尔塞纳的发现将理论和规范理论更加具体化了。1968年维内齐诺(Veneziano)为了解决相互作用而提出了弦理论,发现弦理论是一个可以用来统一四种相互作用力的统一理论,对偶性的研究引出了M理论,马尔达塞纳的研究又将M理论和超弦理论与规范理论(可以用来描叙强相互作用)联系起来,从某种意义上来说,我们又回到了强相互作用的这一点,显然我们对强相互作用的认识有了极大的提高,但是我们仍没有完全解决强相互作用的问题,也没有解决四种相互作用力的统一问题,因此对M理论、超弦理论和规范理论的研究仍是一个长期和非常困难的问题。

哲学思考真正成为问题的是我们这里的一个十分逆反的观点:所谓大统一理论,首先反映的只是人们有关物理学方面的一个思想意向和主观愿望;至于真正的大统一理论内容究竟是什么或怎么样,可能谁也不知道。而且我们还认为这是一个关于大统一理论问题的最基本的思想认识;离开了这个最基本的思想认识,一切大统一理论的基本认识都将是脱离实际的。因此前面介绍的那些人们关于统一场论的探索,可能只是人们在跟着感觉走,而事情的一个本来面目,则还远未被人们所了解。比如,一个极其严重的问题可能是统一场理论或大统一理论,不一定就是强相互作用、弱相互作用、电磁相互作用和万有引力这四种自然力在现行物理学基础上的机械统一;一个把全部物理学都汇合在一个大综合体里的大统一理论,也不一定是应用数学方法(包括重整化方法)把现成物理学知识做统一性的机械组合,等等。总之,我们估计,人们曾经的统一场理论研究,完全有可能在问题研究的对象、方法、立场和角度的出发点地方,一开始就弄错了。而如果我们要达到大统一理论的研究成功,那就可能首先要探索一条与客观事实相适应的物理学发展新道路2。

大统一理论的困难著名的物理学家沈志远提出时空是不连续的吗?20世纪物理学流行的名词是“量子化”,能量、动量、角动量等物理量都是量子化的.量子场论一次量子化还不够,再来个二次量子化.几十年来,物理学家提出各种版本的“万物之理”(统一场论):弦论、圈论、旋子论、扭子论、时空非互易论等,绝大多数基于时空量子化.认为时间和空间都具有最小单元——普朗克时间(10-43秒)和普朗克长度(10-35米)。问题出在他们认为比普朗克时间和普朗克长度更小的时间和空间根本不存在,从而否认时空单元具有内涵.著名圈论研究者斯莫林在专论《时间与空间是什么》的书中强调时间和空间的离散性而否认其连续性,认为连续空间只是“幻觉”(illusion)。在他看来这是通向统一场论的必由之路。这种观点在统一场论界具有代表性.否认连续性偏离量子论主旨。量子化引入离散的量子,但并不否认连续性.以电磁场为例,其能量以光子为单元是离散的,但空间中的电磁场和电磁波却都是连续的。而且正是对连续的电磁场作傅里叶分析,才在封闭空间中得出离散能量谱,在开放空间中则得出连续能量谱。

大统一理论把夸克和轻子看成一种粒子的不同状态,用数学的话来说,大统一理论把夸克和轻子填在同一线性表示里,通过SU(5)规范作用把它们联系起来.强相互作用、弱相互作用和电磁相互作用在非常高的能量(百万亿倍质子的静止能量级,质子静止能量约为10亿电子伏特)下统一成一种SU(5)规范相互作用.随着能量下降,通过黑格斯场的第一次破缺,描写强相互作用的SU(3)对称性和描写弱电相互作用的SU(2)× U(1)对称性分开来了。能量继续下降,在100倍质子静止能量量级,黑格斯场发生第二次破缺,电磁作用和弱作用又分开了,形成实验观测到的三种相互作用.在大统一理论中,夸克和轻子可以通过SU(5)规范场相互转化,原则上质子不再是稳定的,它可能衰变成介子和轻子.尽管理论预言质子衰变的寿命非常长,平均寿命约为1031年,但是质子不稳定造成原子核不稳定,由原子分子构造起来的物质都将是不稳定的。80年代初以来,人们密切注视着实验的发展,但是实验没有观测到大统一理论所预言的质子衰变现象.当然这类实验比较难做,有很强的背景干扰(如宇宙射线干扰),还有人在不断地改进设备和方法,努力寻找质子衰变的事例,人们公认的实验结果是质子的平均寿命大于1032年,所以实验不支持SU(5)大统一模型。

强、弱、电三种相互作用并未得到真正的统一,标准模型也只是一个唯象的理论,其中含有十几个可调参数、任意性太大.物理学家希望,真正的统一方案应该用一个单群来描述三种相互作用的对称性、并且在理论中只出现一个耦合常数来描述相互作用强度,更具体一些说,三种相互作用具有不同的强度,这只是在低能量情况下的行为、是对称性发生破缺的结果.而在更高的能量标度上,三种相互作用统一成为一种力,只有一个作用强度.就像是麦克斯韦方程把电力和磁力统一成为一种电磁相互作用。

标准模型(Standard Model)是几代物理学家辛勤努力的结果。标准模型用来解释宇宙中最基本的组成粒子以及其间的交互作用力,物理学家们认为物质粒子共有六种夸克和三种轻子;物质粒子间的作用力有四种:电磁力、万有引力、强相互作用力和弱相互作用力。标准模型中不包括引力。标准模型似乎是很完善了,但是标准模型不能解释如下的基本事实:无论是核裂变还是核聚变,都会产生大量的中子、中微子和伽马光子(许多中微子的研究就在核反应堆附近进行)。这就是说,物质中有中子、中微子和伽马光子,我们知道,中微子是一种神秘的宇宙粒子,具有不可思议的极强的穿透能力,能够自由地穿过墙壁、山脉、甚至地球与其他行星.物理学家估计,中微子能够自由穿透厚度比地球到太阳的距离还高出几十亿倍的铁板.如果有数光年厚的一个铅做成的壁垒的话,中微子也能从容穿过。这就是说,中微子几乎不同物质发生相互作用.中微子既在物质中存在,但一旦离开了物质,又几乎不再同物质发生相互作用.这是为什么?既然中微子在物质中存在,那么我们要问:中微子为什么能够在物质中存在?换句话说,中微子是被何种粒子的何种作用力囚禁在物质之中的?标准模型不能解释,因为标准模型中不包含囚禁中微子的力.至于伽马光子,同样的问题仍然存在.伽马光子既存在于物质中,又几乎不同任何物质产生相互作用.伽马光子只能感受巨大的引力,但是标准模型中不包括引力。即使标准模型中包括引力,对伽马光子来说也没有什么用处,因为已知的物质粒子的静止质量根本不能提供足以囚禁伽马光子的极其巨大的引力.既然伽马光子在物质中存在,那么我们要问:伽马光子为什么能够在物质中存在?换句话说,伽马光子是被何种粒子的何种作用力囚禁在物质之中的?标准模型不能解释,因为标准模型中不包含囚禁伽马光子的力3。

本词条内容贡献者为:

石季英 - 副教授 - 天津大学

科技工作者之家

科技工作者之家APP是专注科技人才,知识分享与人才交流的服务平台。