物理学中的光子和量子是什么?

“光子”一词最早是化学家吉伯特·刘易斯在1926年,爱因斯坦在1905年发现光电效应的解释后大约五个世纪,用来指爱因斯坦提出的电磁波量子化现象中的粒子。

然而,“光子”概念的诞生要追溯到19世纪中叶,当时黑体辐射正引起物理学家的极大关注。自铁器时代以来,铁匠们就知道,当金属被加热到足够高的温度时,它会发出可见光,在较低的温度下,它会发出暗红色的光,在较高的温度下,它会发出明亮的蓝色光。从金属的亮度和颜色可以判断铁的温度是否合适。

在19世纪,物理学家已经学到了足够多的热力学和电磁学知识。他们知道,高温金属之所以会发光,是因为金属处于高温状态,其上的电荷剧烈运动,从而发出可见光波段的电磁波,而物体因温度而发出的这种电磁波称为黑体辐射。1850年末,热力学和电磁学大师G.R. Kirchhoff对上述现象产生了兴趣,开始研究黑体辐射。

他考虑了在一定温度下由某种材料制成的表面带有小孔的空心容器,得出结论:如果小孔的面积远小于容器内壁的面积,那么通过小孔离开容器的电磁辐射就相当于黑体辐射。其能量在各电磁波段的比重(即频谱)与中空容器的材质和形状无关。唯一影响电磁波频谱的是温度。可惜他得不到光谱的温度函数。在此之后,如何从理论或实验上得到光谱的温度函数,成为物理学家面临的一大挑战。

在随后的40年里,物理学家们做了许多精确的实验,提出了各种模型和理论来解释实验结果。在这些研究中,史蒂文发现黑体辐射的能量密度与温度的4次方成正比,这一点后来被波兹曼用纯热力学的方式证明了。在1893中,Wynn导出了一个频谱的温度函数,但由于函数中有一个未知项,所以这个函数不是一个确定的形式。

黑体辐射光谱的最终正确形式是由马克斯·普朗克发现的。1900年6月的早上,普朗克的同事去他家拜访,带来了前一天实验测得的黑体辐射温度函数。普朗克得出结论,由于黑体辐射的光谱函数与空心容器的材料和形状无关,他可以任意假设空心容器是一个长方形的金属盒。长方体中可以存在的电磁波在电磁学中早就研究的很透彻,同时从热力学中也知道温度会引起电荷的剧烈运动从而发出电磁波,而这些发出的电磁波也必须符合长方体中可以存在的电磁波的模式。

到目前为止,他的假设和计算与瑞利之前失败的假设和计算是一模一样的,所以他也应该得到和瑞利计算一样的错误结论:空心容器中的电磁波能量是无限的。

但在进一步计算之前,普朗克做了一个前所未有的猜想(他自己称之为“快乐猜想”),即长方体中能存在的电磁波的每一个模式,都只有某个常数(后来称为普朗克常数,H)乘以电磁波频率的整数倍的能量(即电磁波每一个模式的能量E = nhf,n是正整数或零,f是电磁波的频率),才能与长方体内壁结合。他在做这个假设时,计算了黑体辐射光谱与温度的关系(称为辐射定律),与他刚刚从同事那里得到的实验数据完全一致。

这个后来被称为辐射定律的结果,成功解决了40年前基尔霍夫设定的挑战。尽管他取得了成功,但普朗克并没有理解他的假设,这个假设有更深层次的物理意义。他后来承认,”...这纯粹是假设,我真的没想到会多加思考。」

19的最后,还有一个著名却无法解释的实验——光电效应实验。赫兹和伦纳德发现,当金属板上有光时,可以测量电流(即一些电子被光照射后,可以获得足够的动能,克服两个金属板之间的势能差,从一个金属板飞到另一个金属板,形成电流),但没有光,就无法测量电流。

但让当时所有科学家困惑的是下面的观察结果。首先是增加照射光的强度,只能增加电流,不能增加电子的动能。第二是红光再强也无法产生光电流。第三,即使用很弱的紫光照射,也能产生光电流,激发电子的动能大于强蓝光激发电子的动能。

1905年,爱因斯坦把普朗克的理论放到了更深的物理意义上,认为光是一个独立的粒子,每个光量子的能量就是光的频率乘以普朗克常数。

他认为电磁波的能量一定是能量包的整数倍,所以光量子激发的电子的能量应该与电磁波的照射无关,只与电磁波的频率有关。严格来说,激射电子的动能应该等于一个电磁波能量包的能量减去电子离开金属所需的能量(称为金属的功函数)。如果我们增加电磁波的照射量,只是增加了发射的电子数和增加的电流,与电子的动能无关。有了这个解释,我们就完全可以理解为什么光电效应实验会有这样的结果了。

当爱因斯坦提出电磁波量子化的概念,特别是对于爱因斯坦钟爱的光粒子,很多科学家都持怀疑态度。其中,普朗克的态度最有趣。虽然他本人是电磁波能量量子化的发起者,但他并不能完全接受光的粒子说。在他的想法中,“我们应该把量子理论的问题变成物质能量和电磁波的相互作用。」

其实这就是“半经典方法”的初衷,即电磁波可以用经典的方式来处理,其振幅可以是连续的,不需要把它当作粒子来处理,只是把物质的能量状态量子化。电磁波能传递给物质的能量的多少,就是这种物质量子态之间的能量差。

即使现在,半经典方法仍然有它的位置。除了一些物理问题,如兰姆位移、光子纠缠等需要用全量子化的方法处理,即把电磁波看成粒子,把物质的能量状态量子化,大部分问题都可以用半经典的方法解决。目前仍有很多教材采用半经典方法计算光电效应。

1912年,爱因斯坦解释的光电效应的推论首先被理查德观测到,然后密立根完整地完成了实验,由此得到了精确的普朗克常数。1922年,康普顿通过X射线散射电子的实验,进一步证实了光的粒子性。在这个实验中,他甚至观察到光的粒子有动量。但是光的粒子到底是什么仍然是一个大问题。

如果光是粒子,爱因斯坦称之为像电子一样的“奇点”,如何解释杨氏干涉实验中光子行走不同距离后仍能自我干涉的现象?爱因斯坦自己也没有答案。晚年,他写道:“经过50年的理性思考,他没有给我任何关于这个问题的答案:光的量子是什么?当然,现在大家都以为自己知道答案了,但是我告诉你,他们是在自欺欺人。」

但是电磁波有两个看似矛盾的性质,粒子和波,这并没有阻止爱因斯坦对光的量子性质进行更多的思考。爱因斯坦花费大量精力研究广义相对论后,在1916年,他回过头来重新考虑了普朗克的辐射定律。

现在有了量子电动力学,我们很容易得到普朗克的辐射定律,但是在1916年,连量子电动力学的前身——量子力学都还没有出现。但爱因斯坦凭借对热力学的深刻理解,推导出了爱因斯坦关于原子在不同能级间跃迁速率的A、B系数。当时从原子光谱实验得知,原子在跃迁过程中分为两种。对应暗线光谱,原子从低能态到高能态吸收光子,而对应亮线光谱,原子从高能态跃迁到低能态并发射光子。然而,没有人知道这两种情况之间的比率关系。

爱因斯坦假设物质与其周围的电磁辐射处于热平衡,而物质处于平衡状态。根据统计力学,不同能级的原子数将由麦克斯韦-波兹曼分布函数决定。

爱因斯坦由此得出,为了达到热平衡,原子在跃迁时必须分为三种:自发辐射——即处于高能态的原子会自然地落到低能态,并发射出一个光子;受激吸收——即处于低能态的原子会吸收一个光子,然后跃迁到高能态;而最后也是最令人惊讶的一种,受激辐射——即处于高能态的原子会被其他光子激发而陷入低能态,同时发射出一个光子。因为受激辐射的存在,科学家们得以在40年后成功发明激光,这是后话。爱因斯坦还获得了这三种不同类型的原子跃迁发生率的比值。

1927年,狄拉克成功地将电磁波完全量子化,后来狄拉克和其他物理学家将这一理论发展为量子电动力学。这个理论确实成功超越了光粒子和波的二元性,解决了半经典方法无法解决的问题。同时发现在没有任何电磁波的真空中存在“零点能”,这是真空电磁扰动造成的。而且自发辐射自然发生的原因,本来是不可理解的,也回答了。自发辐射可以看作是一种受激辐射,激发它的光子来自真空电磁扰动。

但是,量子电动力学不能告诉我们光子在哪里。与电子不同,电子的位置在量子力学中有一个位置算符,而光子却没有对应的光子位置算符。爱因斯坦认为光子和电子一样是奇点,在量子电动力学中并没有得到完全的背书。

后来有更多的证据支持电磁波的完全量子化,其中最著名的是1947观测到的兰姆偏移。兰姆在实验中观察到,原子光谱2s1/2和2p1/2的两个轨道域能量相差不大,但根据相对论量子力学,这两个态应该具有相同的能量。但一年后,量子电动力学成功解释了兰姆位移,因为真空扰动的能量会使电子从原来的轨道域发生位移,而S轨道域更靠近带正电荷的原子核,因此比P轨道域受到的影响更大,所以两者会有微小的能量差异。

即使量子电动力学已经解决了很多半经典方法无法解决的问题,仍然有物理学家怀疑没有必要量子化电磁波,修改半经典方法仍然可以得到完整的理论。这个修正就是把原子跃迁后产生的电磁波加到原来的电磁波上,与原子相互作用。实际上自发辐射可以用这个方法解释,但是兰姆迁移从头到尾都不能用修正的半经典方法解释。

直到现在,很多科学家还在研究光子。其中,纠缠光子对、多光子干涉、量子拍频、远距离量子传输和量子通信都是研究的热点,量子电动力学的理论足以解释这些结果。但我们仍然对这两个问题感兴趣——光子是什么?光子在哪里?没有人回答。也许在1926年,路易给“光子”命名的时候,并没有想到“光子”在下一个世纪依然保持神秘。

1900 ~ 1926是量子力学的孕育期。这个时候的量子力学是半经典半量子理论,叫旧量子理论,是从德国物理学家普朗克对黑体辐射的研究开始的。黑体辐射是1900经典物理学(牛顿力学、麦克斯韦电动力学、热力学、统计物理)无法解决的几个难题之一。旧理论导出的黑体辐射谱会产生发散困难,与实验不符。普朗克随后提出了“能量量子”的概念,认为黑体由大量振子组成,每个振子的能量是振子频率的整数倍,因此推导出的黑体辐射谱与实验完全一致。“能量量子”是一个新概念,它表明微观系统的能量可能是间歇性的、跳跃性的,与经典物理学完全不同,于是普朗克吹响了新的物理旅程的号角,成为现代物理学的开端之一。1905年,爱因斯坦将普朗克的“能量量子”概念更进了一步,认为辐射能本来就是一部分,是由非独立振子引起的,每一部分都有一个物质承担者——光量子,从而成功地解释了光电效应。爱因斯坦本人在几年后成功地将量子理论应用于固体比热的问题。1912年,丹麦青年玻尔根据普朗克的量子理论、爱因斯坦的光子理论和卢瑟福的原子行星结构模型,成功地推导出了氢原子谱线位置的公式,从此掀起了研究量子理论的热潮。1924年,一位年轻的法国贵族德布罗意根据光的波粒二象性理论、相对论和玻尔理论推断出一般的物理粒子也应该有涨落,提出物质波的概念,得到爱因斯坦的赞许和实验的验证,直接导致奥地利学者薛定谔在1926年发明了量子力学的波动方程。同时,德国青年海森堡受玻尔对应原理和协同学原理的影响,提出了与薛定谔波动力学等价但形式不同的矩阵力学,同样可以成功解释原子光谱问题。矩阵力学和波动力学合称为量子力学,量子力学正式诞生。量子力学和经典力学对物质的描述有着本质的区别。量子力学认为“粒子轨道”这个概念是没有意义的,因为我们无法同时确定一个粒子的动量和位置。我们能知道的是粒子出现在空间的概率。量子力学用波函数和算符力学量代替过去的轨道和速度概念,把不可约代数引入物理学。量子力学也首次引入了复数。

过去物理学中复数的引入只是一种方便的技巧,并没有真正的意义。但在量子力学中,虚数具有基本的物理意义,正如英国物理学家狄拉克在20世纪70年代所说:“……这个复相极其重要,因为它是所有相关现象的根源,它的物理意义难以理解……正是因为它隐藏得如此巧妙,人们才未能更早地建立量子力学。”可见,复数第一次在量子力学中有了不可替代的物理意义。这个狄拉克在20世纪20年代后半期把薛定谔的非相对论波动方程推广到相对论情况,第一次实现了量子力学和相对论的联姻。狄拉克方程是一个相对论性波动方程,描述了一大类具有半整数自旋的粒子,如电子。因为组成现实世界的物质是自旋为1/2的电子、质子和中子,所以狄拉克方程显然特别重要。狄拉克方程可以自然地预言电子的自旋是1/2,解释氢原子的精细结构,预言正电子的存在。不久,安德森发现了正电子。狄拉克方程已经成为量子力学中最著名的方程之一。这个狄拉克还量子化了电磁场,从理论上证实了1905中爱因斯坦光子理论最重要的一点——光是由光子组成的。作为一个体系,量子力学的建立是在20世纪20年代后期完成的,然后应用于实际问题。

量子力学基础与应用

对于很多人来说,也许量子力学比相对论更有用。后者一般用于研究基本粒子的产生和相互转化以及大尺度的时空结构,但对于20世纪人类的生产生活来说,原子层面的世界更为重要。20世纪30年代,量子力学应用于固体物理,建立了凝聚态物理和分子物理,建立了量子化学。在此基础上,材料科学、激光技术、超导物理等学科蓬勃发展,为20世纪深刻影响人们生活方式的计算机技术、信息技术和能源技术的发展奠定了基础。20世纪上半叶,量子力学深入微观世界,发展了核结构和动力学理论,提出了核结构的壳模型和集体模型,研究了核的α、β、γ嬗变等主要反应。天体物理学必须使用量子力学。对于那些密度很高的天体,比如白矮星、中子星,当核燃料耗尽时,恒星的引力会使其坍缩。高密度天体的费米温度很高,远高于恒星的实际温度。白矮星的电子气并合压和中子星的中子并合压与引力竞争。这时,量子力学效应对恒星的形成起着决定性的作用。对于一个黑洞来说,它附近的狄拉克真空的正负能级会错开,所以一些负能量粒子可能会通过隧道效应穿透禁区,变成正能量粒子,飞到很远的地方。黑洞的量子力学效应非常有意义,值得研究。

虽然量子力学取得了巨大的成功,但是与牛顿力学相比,量子力学与常识的决裂更加彻底,所以关于量子力学的基础还有很多争论,正如玻尔所说:“谁不被量子力学震撼,谁就不会理解量子力学。”20世纪上半叶,爱因斯坦和玻尔就量子力学是否自足完备展开了大讨论,引发了一系列以量子力学为基础的工作,如隐变量理论、贝尔定理、薛定谔的猫态实验等。这些工作让我们看到了理解量子力学的困难。

量子力学的应用,一方面让我们感受到现实世界多姿多彩、光怪陆离的特点,另一方面也促进了我们对量子力学基础的理解。20世纪下半叶,量子力学在基础和应用研究中焕发了青春。对超导的本质、真空卡西米尔效应、分数和整数量子霍尔效应、A-B效应和几何相位因子、玻色-爱因斯坦凝聚和原子激光的研究极大地丰富了人们对物理世界的认识,对这些效应和技术的研究必将对21世纪的科学进步产生深远的影响。量子力学深入发展。量子力学是单个粒子的运动理论。在高能的情况下,会产生粒子并湮灭,涉及多个粒子。因此,有必要将量子力学发展为量子场论。第一个用来研究相互作用的量子场论是量子电动力学。量子电动力学研究电子与光子的量子碰撞,是在研究氢原子的超精细结构——电子的兰姆运动和反常磁矩的基础上,于20世纪三四十年代建立起来的。费曼等人发展的路径积分量子化方法是研究相互作用场量子化的有力工具。利用它,计算散射矩阵和反应截面成为可能。量子场论是一个空洞的框架,必须引入相互作用来描述相互作用粒子的产生和转化,研究其本质。这是规范场论的任务。量子场论和规范场论是量子力学深入发展的结果。量子电动力学具有U(1)群(可交换的内对称群)的局域正则对称性。通过改变带电粒子波函数的定域相位和相应的电磁势变换,发现为了保持这种变换的不变性,必须引入带电粒子与电磁场(一种规范场)的耦合项。当时的微观世界中,除了电磁力,还有控制原子核聚集的强力和控制原子核衰变的弱力。这些相互作用满足什么样的动力学方程需要一个第一性原理解。

在1954中,杨振宁和米尔斯将定域规范不变性理论扩展到内部对称的非对易群,并引入了非阿贝尔规范场。Young-Mills理论确定了相互作用的基本形式,成为理论物理中继相对论洛伦兹变换之后最重要的变换形式。洛伦兹变换是时空变换,规范变换是内部空间变换,分别从外部和内部决定物质运动和相互作用的形式。六七十年代的工作包括1964年发现真空对称性自发破缺的希格斯机制,1971年法德夫和波波夫首先用路径积分量子化方法得到规范场的正确量子化方案。Te Hooft等人证明了规范场理论的重正化,并提出了一个实用的维数归一化方案。

在规范场理论、粒子物理实验和基本粒子结构(三代轻子和三代夸克)的基础上,上世纪六七十年代提出了特殊规范场理论——弱电流统一理论和量子色动力学。由于胶子传递变色(强)力的证据在1979被发现,中间玻色子W和Z0传递弱相互作用的证据在1984被发现,我们确信描述弱相互作用和电磁相互作用的统一理论是描述强相互作用的SU(2)×U(1)规范场模型。这两种模型统称为标准模型。物理学家在1995年发现了他们预言的最重夸克(顶夸克)存在的证据,他们预言的最后一个基本粒子(τ中微子)也是在2000年发现的。库尔特·胡夫特的工作也获得了1999诺贝尔物理学奖。标准模型的反复成功使它成为关于物质结构、物质运动和相互作用的最佳理论。

量子力学和量子场论让人类对真空的本质有了更本质的看法。过去,真空被认为是空的。自狄拉克提出真空是“负能量粒子的海洋”以来,真空一直被视为粒子的来源。真空有很多效应,如反映真空能量为零的卡西米尔效应、真空极化引起的氢光谱兰姆位移(氢原子的超精细结构)、受激原子与零真空相互作用引起的原子自发辐射等。真空作为量子场的基态,具有普适对称性。20世纪60年代,南中国和歌德-柊司发现量子场论真空会自发破缺对称性,70年代,波利亚科夫等人发现了真空的拓扑结构。目前真空可以局部操作,真空已经上升到交互作用研究的学科地位。

总结

有百年历史的量子力学对20世纪的科学技术产生了革命性的影响。正是由于其深远的影响,在世纪之交,它带给我们越来越多的未解之谜。李政道认为,20世纪后期存在以下物理之谜:夸克禁闭、暗物质、对称性破缺、真空性质等等。此外,解决了质量的起源、电荷的本质、量子引力、基本粒子的世代重复等谜团,也会带来新的物理进展。为了探索物质世界的深刻本质,大统一理论、超对称性、超引力、超弦理论也在发展。它们可能是新革命的前奏。虽然我不知道像量子力学诞生这样的革命能否再次发生,但未来的100年肯定会让物理学家们忙个不停,这些新概念、新理论、新技术会对未来人类的观念和生活产生巨大的影响,目前可能还不在我们的掌控之中。