在这篇1905年发表的历史性论文中,阿尔伯特·爱因斯坦提出了一个颠覆性观点:光不仅表现为连续波,还表现为一组离散的能量粒子。这一光量子(现称光子)假说解释了经典波动理论无法阐明的现象,例如光电效应、黑体辐射或光致发光。该研究奠定了量子理论的基础,并使爱因斯坦于1921年获得诺贝尔物理学奖。
阿尔伯特·爱因斯坦(1905年)——翻译(公共领域)。
麦克斯韦关于所谓“空空间”中电磁过程的理论,与当前气体及其他物质的理论模型存在根本性的本质差异。一方面,我们认为物质体的状态完全由有限数量(尽管数量极其庞大)的原子和电子的位置与速度决定。相比之下,空间区域的电磁状态则由连续函数描述,因此无法通过任何有限数量的变量精确确定。于是,根据麦克斯韦理论,纯电磁现象(如光)的能量应表示为空间的连续函数。而物质体的能量则应表示为原子和电子的离散总和;因此,物质体的能量无法被分割成任意多、任意小的组成部分。
然而,根据麦克斯韦理论(或任何波动理论),点光源发出的光波能量会连续分布到不断增大的体积中。光的波动理论凭借其连续的空间函数,已被证明是纯光学现象的卓越模型,且很可能永远不会被其他理论取代。尽管如此,我们应当认识到,光学实验观测到的仅是时间平均值而非瞬时值。因此,尽管麦克斯韦理论与实验完美吻合,但用连续空间函数描述光仍可能在应用于光的产生与转化时与实验产生矛盾。
特别是,黑体辐射、光致发光、阴极射线在紫外光下的产生,以及与光的产生和转化相关的其他现象,似乎更适宜通过假设光的能量在空间中不连续分布来建模。根据这一图景,从点光源发出的光波能量并非连续地扩散至越来越大的体积,而是由有限数量的能量量子组成,这些量子在空间点上局域化,运动时不分裂,且仅作为整体被吸收或产生。接下来,我希望解释引导我得出这一光图景的推理过程和支撑证据,以期对某些研究人员的实验有所助益。
我们首先将麦克斯韦的光与电子理论应用于以下情形:设有一个具有完全反射壁的空腔,内部充满大量自由运动的电子和气体分子,这些粒子在相互接近时通过保守力相互作用,即如同气体分子运动论中的气体分子一样发生碰撞。[1]此外,设存在若干电子,它们被束缚在空间上彼此充分分离的点上,束缚力随位移线性增大。这些电子在与其他自由分子及电子极接近时,也会通过保守势能发生相互作用。我们将这些束缚于空间各点的电子称为“谐振子”,因为它们吸收并发射特定周期的电磁波。
根据当前的光产生理论,腔内的辐射必须等同于黑体辐射(可通过假设麦克斯韦理论和动态平衡得出),至少当假设所考虑频率范围内存在谐振子时成立。首先,我们暂不考虑谐振子吸收和发射的辐射,而是聚焦于热平衡的要求及其对分子与电子之间相互作用(碰撞)的影响。
根据气体分子运动论,动态平衡要求谐振子的平均动能等于自由运动气体分子的平均动能。将谐振子电子的运动分解为三个相互垂直的振动,我们发现这种线性振动的平均能量 \(\bar{\varepsilon}\) 为
\[ \bar{\varepsilon} = \frac{R}{N} T \]
其中 \(R\) 为绝对气体常数,\(N\) 为每克当量中"真实分子"的数量,\(T\) 为绝对温度。由于动能和势能的时间平均值,能量 \(\bar{\varepsilon}\) 是单个自由气体分子动能的 \(2/3\)。即使某些因素(如辐射过程)导致谐振子的时间平均能量偏离 \(\bar{\varepsilon}\) 值,通过与自由电子和气体分子的碰撞,其平均能量会通过吸收或释放能量恢复至 \(\bar{\varepsilon}\)。因此,在此情况下,只有当每个谐振子均具有平均能量 \(\bar{\varepsilon}\) 时,动态平衡才能存在。
我们现在将类似的考虑应用于谐振器与腔内环境辐射之间的相互作用。对于这种情况,普朗克推导出了动态平衡的必要条件;[2] 他将辐射视为完全随机的过程。[3] 他发现:
\[ \bar{\varepsilon} = \frac{L^3}{8\pi} \frac{1}{\nu^2} \frac{\rho_\nu}{d\nu} \]
这里,\(\bar{\varepsilon}\) 是固有频率为 \(\nu\) 的谐振子的平均能量(每个振动分量),\(L\) 是光速,\(\nu\) 是频率,\(\rho_\nu d\nu\) 是频率介于 \(\nu\) 和 \(\nu + d\nu\) 之间的腔体辐射能量密度。若频率为 \(\nu\) 的净辐射能量不持续增加或减少,则必须满足以下等式:
\[ \bar{\varepsilon} = \frac{R}{N} T \]
或者,等价地,
\[ \frac{R}{N} T = \frac{L^3}{8\pi} \frac{1}{\nu^2} \frac{\rho_\nu}{d\nu} \]
动态平衡的这一条件不仅与实验不符,还消除了物质与以太之间任何平衡的可能性。谐振器频率范围选择得越宽,空间中的辐射能量就越大,最终我们得到:
\[ \int_0^\infty \rho_\nu d\nu = \infty \]
在下一节中,我们将证明普朗克先生对基本量子的确定在某种程度上独立于他所创立的“黑体辐射”理论。普朗克[4]给出的关于\(\rho_\nu\)的公式,迄今为止足以解释所有实验。
\[ \rho_\nu = \frac{8\pi \nu^2}{L^3} \frac{h\nu}{e^{h\nu/kT} - 1} \]
哪里
\[ h = \frac{R}{N} \frac{\ln C}{C} \]
在 \(T/\nu\) 值很大的极限下,即对于大波长和高辐射密度,该公式趋近于以下形式:
\[ \rho_\nu = \frac{8\pi \nu^2}{L^3} \frac{R}{N} \frac{T}{\nu} \]
可以看出,这个公式与从麦克斯韦理论和电子理论推导出的公式相同。令公式中的系数相等:
\[ \frac{R}{N} = \frac{h\nu}{e^{h\nu/kT} - 1} \cdot \frac{1}{T} \]
or
\[ N = \frac{R}{k} \]
即一个氢原子重 \(1/N\) 克 \(= 1.62 \times 10^{-24}\,\text{克}\)。这正是普朗克先生所求得的值,与其他方法获得的结果吻合良好。由此我们得出结论:辐射的能量密度和波长越大,我们所采用的理论基础就越适用;但对于短波长和低辐射密度的情况,该基础则完全失效。
以下将根据经验来考虑“黑体辐射”,而不对辐射的产生与传播过程形成具体图像。
以下讨论包含于维恩先生的一部著名著作中,此处仅出于完整性考虑加以收录。设辐射占据体积\(v\)。我们假定,当所有频率的辐射密度\(\rho(\nu)\)给定时,辐射的可观测性质便完全确定。[5]由于可将不同频率的辐射视为可分离的(无需做功或传热),辐射的熵可表示为如下形式:
\[ S = \int \phi(\rho, \nu)\, d\nu \]
其中 \(\phi\) 是变量 \(\rho\) 和 \(\nu\) 的函数。通过表达反射壁间辐射的熵在绝热压缩下不变,可将 \(\phi\) 简化为仅含一个变量的函数。然而我们暂不深入探讨这一点,而是直接研究如何从黑体辐射定律中得出函数 \(\phi\)。
在“黑体辐射”的情况下,\(\rho\) 是 \(\nu\) 的一个函数,使得对于给定的能量,熵取最大值,即
\[ \delta \left( S - \frac{E}{T} \right) = 0 \]
当
\[ E = \int \rho(\nu)\, d\nu \]
由此可知,对于任意选择的 \(\rho\)
\[ \frac{\partial \phi}{\partial \rho} = \frac{1}{T} \]
其中 \(T\) 与 \(\nu\) 无关。因此
\[ \frac{\partial^2 \phi}{\partial \rho^2} = 0 \]
与 \(\nu\) 无关。对于体积 \(v = 1\) 的黑体辐射温度升高 \(dT\),以下方程成立:
\[ dE = \int \frac{\partial \rho}{\partial T} d\nu\, dT \]
或者,由于 \(\frac{\partial \phi}{\partial \rho}\) 与 \(\nu\) 无关:
\[ dS = \int \frac{\partial \phi}{\partial \rho} \frac{\partial \rho}{\partial T} d\nu\, dT \]
由于 \(dE\) 等于传递的热量,且过程是可逆的,我们还有:
\[ dS = \frac{dE}{T} \]
令公式相等可得:
\[ \frac{dE}{T} = \int \frac{\partial \phi}{\partial \rho} \frac{\partial \rho}{\partial T} d\nu\, dT \]
这就是黑体辐射定律。因此,可以通过函数\(\phi\)来确定黑体辐射。反之,通过积分可以从黑体辐射定律推导出\(\phi\),同时需注意当\(\rho = 0\)时\(\phi\)为零。
诚然,迄今为止对"黑体辐射"的观测表明,维恩先生最初为"黑体辐射"提出的定律并非完全有效。然而,对于较大的\(\nu/T\)值,实验完全证实了该定律。我们将基于此公式进行计算,同时谨记其结果仅在特定限制条件下有效。
首先,从这个方程我们得到:
\[ \rho(\nu, T) = a\nu^3 e^{-b\nu/T} \]
然后,利用前一节得到的关系:
\[ \phi(\rho, \nu) = -\frac{\rho}{b\nu} \ln \left( \frac{\rho}{a\nu^3} \right) \]
设有一辐射能量 \(E\),其频率介于 \(\nu\) 与 \(\nu + d\nu\) 之间。设该辐射占据体积 \(v\)。此辐射的熵为:
\[ S = -\frac{E}{b\nu} \ln \left( \frac{E}{a\nu^3 v} \right) \]
我们将仅限于研究辐射熵对其所占据体积的依赖性。设辐射占据体积\(v_0\)时的熵为\(S_0\),则有:
\[ S - S_0 = \frac{E}{b\nu} \ln \left( \frac{v}{v_0} \right) \]
该方程表明,足够低密度的单色辐射的熵随体积变化的规律,与理想气体或稀溶液的熵变规律相同。下文将依据玻尔兹曼先生提出的原理——即系统的熵是其状态概率的函数——对刚推导出的方程进行诠释。
在基于分子理论计算熵时,“概率”一词常被用于一种未被概率论定义所涵盖的含义。特别是“等概率情形”往往通过假设设定,而实际应用的理论表述已足够明确,无需通过假设固定概率即可推导出概率。我将在另一项工作中证明,在处理热过程时,利用所谓的“统计概率”可得到完整结果。通过这种方式,我希望消除阻碍完全实现玻尔兹曼原理的逻辑困难。然而,此处仅给出其一般性表述及在特定情形下的应用。
当讨论系统状态的概率有意义时,并且每个熵的增加都可以描述为向更可能状态的转变,系统的熵 \(S_1\) 是其瞬时状态概率 \(W_1\) 的函数。对于两个系统 \(S_1\) 和 \(S_2\),可以表述为:
\[ S = S_1 + S_2,\quad W = W_1 W_2 \]
若将这些系统视为一个具有熵 \(S\) 和概率 \(W\) 的单一系统,则:
\[ S = f(W),\quad S_1 = f(W_1),\quad S_2 = f(W_2) \]
and
\[ W = W_1 W_2 \]
后一个方程表示两个系统的状态是独立的。由这些方程可得:
\[ f(W_1 W_2) = f(W_1) + f(W_2) \]
因此最终
\[ S = k \ln W + C \]
常数 \(k\) 也是一个普适常数;它源于气体动力学理论,其中常数 \(R\) 和 \(N\) 的含义与上文相同。若将某一特定初始状态的熵记为 \(S_0\),并将熵为 \(S\) 的状态的相对概率记为 \(W\),则一般有:
\[ S - S_0 = k \ln W \]
现在我们考虑以下特殊情况。设体积 \(v_0\) 中存在若干(\(n\) 个)可移动的点(例如分子),这些点将成为我们讨论的对象。除此之外,还可以存在任意多个其他可移动的点。关于这些被考虑的点在空间中如何运动的规律,唯一的假设是:空间的任何部分(以及任何方向)都不比其他部分更受偏爱。我们所考虑的(首先提到的)点的数量非常少,以至于它们之间的相互作用可以忽略不计。所考虑的系统(例如理想气体或稀释溶液)具有特定的熵。
我们从体积 \(v_0\) 中取一部分大小为 \(v\) 的容积,并设想所有 \(n\) 个可移动点都位移到该容积 \(v\) 中,系统的其他部分保持不变。显然,这一状态具有不同的熵(\(S\)),而我们希望借助玻尔兹曼原理来确定该熵差。问题在于:相对于原始状态,最后提及的状态的概率有多大?或者说,在某一时刻,体积 \(v_0\) 中所有 \(n\) 个独立运动的点偶然全部落入体积 \(v\) 的概率是多少?
对于这个概率,它是一个“统计概率”,其值为:
\[ W = \left( \frac{v}{v_0} \right)^n \]
由此,应用玻尔兹曼原理可得:
\[ S - S_0 = k n \ln \left( \frac{v}{v_0} \right) \]
值得注意的是,对于这一推导过程——从中可以轻松通过热力学推导出玻意耳-盖吕萨克定律和相同的渗透压定律[6]——无需对分子运动方式做出任何假设。
在第4段中,我们得到了单色辐射熵对体积依赖关系的表达式:
\[ S - S_0 = \frac{E}{b\nu} \ln \left( \frac{v}{v_0} \right) \]
该公式可改写如下:
\[ S - S_0 = k \ln \left( \frac{v}{v_0} \right)^{E/h\nu} \]
将此与表达玻尔兹曼原理的一般公式进行比较,我们得出以下结论:如果频率为\(\nu\)、能量为\(E\)的单色辐射(通过反射壁)封闭在体积\(v_0\)中,那么在任意时刻,位于体积\(v_0\)的一部分\(v\)中的所有辐射能量的概率为:
\[ W = \left( \frac{v}{v_0} \right)^{E/h\nu} \]
随后我们得出结论:在热理论中,低密度单色辐射(在维恩辐射公式的有效范围内)的表现仿佛由大小为 \(\frac{R}{N} \nu\) 的独立能量量子组成。
我们还希望比较“黑体辐射”能量量子的平均大小与同温度下分子质心运动的平均能量。后者为\(\frac{3}{2} (R/N) T\),而维恩公式给出的能量量子平均能量为:
\[ \bar{\varepsilon}_\nu = \frac{R}{N} \nu \]
单色辐射(在足够低的密度下)在熵对体积的依赖关系上,表现得像是由大小为 \(R\nu/N\) 的能量量子组成的非连续介质,这一事实提示我们应当探究:如果光确实由这样的能量量子构成,那么光的产生和转化定律是否必然如此。接下来我们将探讨这一问题。
设单色光通过光致发光转化为另一频率的光,并假设根据刚刚得到的结果,生成光与生成的光均由大小为 \((R/N) \nu\) 的能量量子构成,其中 \(\nu\) 为对应频率。该转化过程可解释如下:每个频率为 \(\nu_1\) 的生成能量量子被吸收,并在生成能量量子密度足够小的情况下,自行产生一个频率为 \(\nu_2\) 的光量子;同时可能产生其他频率(如 \(\nu_3, \nu_4\) 等)的光量子以及其他形式的能量(例如热能)。最终结果通过何种中间过程实现并不重要。
如果光致发光物质不是连续的能量源,根据能量原理,产生的能量量子的能量不会大于激发光量子的能量;因此必须满足以下关系:
\[ h\nu_2 \leq h\nu_1 \]
or
\[ \nu_2 \leq \nu_1 \]
众所周知,这是斯托克斯定律。尤其值得注意的是,在弱光照条件下,其他条件相同时,产生的光量必须与激发光量成正比,因为每个入射能量量子都会引发上述类型的一个基本过程,且不受其他激发能量量子作用的影响。特别地,激发光强度不存在下限,低于此限度的光将无法激发荧光。
根据此处对现象的理解方式,在以下情况下可设想偏离斯托克斯规则:
最后提到的可能性值得特别关注。根据现有的理解,不能排除在维恩定律的有效范围内,“非维恩辐射”即使在高度稀释的情况下,其能量行为也可能与“黑体辐射”不同。
通常认为光能量在传播空间中连续分布的理解,在试图解释光电现象时会遇到极大的困难,正如莱纳德先生在其开创性论文[7]中所阐述的那样。根据激发光由能量为\((R/N)\nu\)的量子所构成的理解,光产生阴极射线的过程可作如下构想。
能量量子穿透固体的表层,其能量至少部分转化为电子的动能。最简单的图景是:一个光量子将其全部能量传递给单个电子;我们假设这种情况会发生。然而,不能排除电子仅部分接受光量子能量的可能性。一个获得动能的电子在到达表面时会损失部分能量。除此之外,我们必须假设每个电子离开固体时都需要做功 \(P\)(该固体的特征值)。
位于表面正上方的电子,若以垂直于表面的方向被激发,将以最大的法向速度离开固体。此类电子的动能为
\[ \frac{1}{2} m v^2 = h\nu - P \]
若物体被充电至正电势 \(\Pi\),且周围导体电势为零,且 \(\Pi\) 恰好足以防止物体漏电,则必有:
\[ h\nu - P = e\Pi \]
其中 \(e\) 是电子的电荷量,或
\[ \Pi = \frac{h\nu - P}{e} \]
其中 \(E\) 是单价离子一克当量的电荷,\(P'\) 是该负电量相对于该物体的电势。[8] 若设 \(E = 9.6 \times 10^3\),则 \(\Pi \times 10^{-8}\) 为该物体在真空中受到照射时所达到的电势(以伏特为单位)。
为检验推导关系是否与实验在数量级上一致,我们设 \(P' = 0\),\(\nu = 1.03 \times 10^{15}\)(对应太阳光谱的紫外极限),以及 \(h = 4.866 \times 10^{-27}\)。得到 \(\Pi \times 10^7 = 4.3\) 伏特,这与勒纳德先生的结果[9]在数量级上相符。
若推导出的公式正确,则\(\Pi\)作为激发光频率的函数(以笛卡尔坐标表示)必为一条直线,其斜率与所研究物质的性质无关。就目前所见,我们的理解与勒纳德先生观测到的光电效应特性之间并无矛盾。
若激发光的每个能量量子独立地向电子释放其能量,则电子的速度分布(即所产生阴极射线的性质)将独立于激发光的强度;而在其他条件相同的情况下,离开物体的电子数量将与激发光的强度成正比。[10] 我们预期,这些规则的有效性边界在本质上将与斯托克斯定律的预期偏差相似。
在前文中,我们假设产生光的能量量子中至少有一部分能量完全转移给了单个电子。若不基于这一自然假设,则上述方程应替换为:
\[ h\nu = P + e\Pi + E_{\text{loss}} \]
对于阴极发光,这构成了刚才所考察过程的逆过程,通过类似的考虑可得:
\[ h\nu = e\Pi - P \]
对于勒纳德先生所研究的材料,\(P e\) 始终显著大于 \(h\nu\),因为阴极射线为产生可见光所需穿越的电压在某些情况下为数百伏,在其他情况下则达数千伏。[11]
我们必须假设,在气体被紫外线电离的过程中,一个吸收的光能量量子总是用于电离一个气体分子。由此首先得出,一个分子的电离能(即理论上电离所需的能量)不可能大于一个吸收的光能量量子的能量。设 \(J\) 为每克当量的(理论)电离能,则有:
\[ J \leq \frac{E}{N} h\nu \]
根据莱纳德对空气的测量,产生效应的最大波长约为 \(1.9 \times 10^{-5}\,\text{cm}\)。
\[ \nu = \frac{c}{\lambda} \approx 1.6 \times 10^{15}\,\text{s}^{-1} \]
电离能的上限也可以通过稀薄气体中的电离电压获得。根据Stark[12]的结论,在空气中测得的最小电离电压(使用铂阳极)约为10伏特[13]。因此,我们得到\(J\)的上限为\(9.6 \times 10^{12}\),这与刚才得出的数值几乎相同。
我认为还有另一个非常重要的结果需要验证。如果每个光能量量子电离一个分子,那么吸收的光量 \(L\) 与由此电离的克分子数 \(j\) 之间必须存在以下关系:
\[ L = j h\nu \]
如果我们的理解反映了现实,那么对于每一种(在特定频率下)没有吸收且不伴随电离的气体,这一关系必须成立。
伯尔尼,1905年3月17日
权利说明:以上英文文本是爱因斯坦1905年论文的维基文库译本,注明为公共领域作品(包括原文和译文)。
本文提出了一个革命性的观点:光除了具有波动行为外,还可以表现为离散粒子(量子)。这一观点解决了诸如光电效应等悖论,并为量子力学奠定了基础。
光量子是电磁能量的离散包。如今,我们称它们为光子。 与可具有任意能量的经典波不同,光子的能量由其频率决定,是固定的:E = hν。
爱因斯坦提出,每个光子将其全部能量传递给金属中的一个电子。如果该能量超过功函数(即电子脱离金属所需的能量),电子便会以动能hν - P被发射出来,其中P为功函数。
波动理论预测,发射电子的能量将取决于光的强度,而非频率。然而,勒纳的实验表明,电子的能量仅取决于光的频率,而非其强度。
爱因斯坦使用了马克斯·普朗克于1900年为解释黑体辐射而引入的普朗克常数h。爱因斯坦是第一个认识到该常数具有更深层物理意义的人,这一意义与能量的本质息息相关。
光具有粒子性质的观点如此激进,以至于历经多年才被科学界接受。直到1923年康普顿实验(康普顿散射)才最终证实了光的粒子性。
1905年常被称为爱因斯坦的奇迹之年,因为他在那一年发表了四篇革命性论文,包括这篇关于光量子的论文以及关于狭义相对论的论文。尽管这些著作看似不同,但它们有一个共同点:挑战既有观念,提出新的理论框架来解释无法解释的现象。