关于光的产生和转化的一个启发性观点（爱因斯坦，1905）

光量子理论的基础论文

在这篇1905年发表的历史性论文中，阿尔伯特·爱因斯坦提出了一个颠覆性观点：光不仅表现为连续波，还表现为一组离散的能量粒子。这一光量子（现称光子）假说解释了经典波动理论无法阐明的现象，例如光电效应、黑体辐射或光致发光。该研究奠定了量子理论的基础，并使爱因斯坦于1921年获得诺贝尔物理学奖。

关于光的产生和转化的一个启发性观点

麦克斯韦关于所谓“空空间”中电磁过程的理论，与当前气体及其他物质的理论模型存在根本性的本质差异。一方面，我们认为物质体的状态完全由有限数量（尽管数量极其庞大）的原子和电子的位置与速度决定。相比之下，空间区域的电磁状态则由连续函数描述，因此无法通过任何有限数量的变量精确确定。于是，根据麦克斯韦理论，纯电磁现象（如光）的能量应表示为空间的连续函数。而物质体的能量则应表示为原子和电子的离散总和；因此，物质体的能量无法被分割成任意多、任意小的组成部分。

然而，根据麦克斯韦理论（或任何波动理论），点光源发出的光波能量会连续分布到不断增大的体积中。光的波动理论凭借其连续的空间函数，已被证明是纯光学现象的卓越模型，且很可能永远不会被其他理论取代。尽管如此，我们应当认识到，光学实验观测到的仅是时间平均值而非瞬时值。因此，尽管麦克斯韦理论与实验完美吻合，但用连续空间函数描述光仍可能在应用于光的产生与转化时与实验产生矛盾。

特别是，黑体辐射、光致发光、阴极射线在紫外光下的产生，以及与光的产生和转化相关的其他现象，似乎更适宜通过假设光的能量在空间中不连续分布来建模。根据这一图景，从点光源发出的光波能量并非连续地扩散至越来越大的体积，而是由有限数量的能量量子组成，这些量子在空间点上局域化，运动时不分裂，且仅作为整体被吸收或产生。接下来，我希望解释引导我得出这一光图景的推理过程和支撑证据，以期对某些研究人员的实验有所助益。

关于“黑体辐射”理论的一个特定问题

我们首先将麦克斯韦的光与电子理论应用于以下情形：设有一个具有完全反射壁的空腔，内部充满大量自由运动的电子和气体分子，这些粒子在相互接近时通过保守力相互作用，即如同气体分子运动论中的气体分子一样发生碰撞。[1]此外，设存在若干电子，它们被束缚在空间上彼此充分分离的点上，束缚力随位移线性增大。这些电子在与其他自由分子及电子极接近时，也会通过保守势能发生相互作用。我们将这些束缚于空间各点的电子称为“谐振子”，因为它们吸收并发射特定周期的电磁波。

根据当前的光产生理论，腔内的辐射必须等同于黑体辐射（可通过假设麦克斯韦理论和动态平衡得出），至少当假设所考虑频率范围内存在谐振子时成立。首先，我们暂不考虑谐振子吸收和发射的辐射，而是聚焦于热平衡的要求及其对分子与电子之间相互作用（碰撞）的影响。

根据气体分子运动论，动态平衡要求谐振子的平均动能等于自由运动气体分子的平均动能。将谐振子电子的运动分解为三个相互垂直的振动，我们发现这种线性振动的平均能量 \(\bar{\varepsilon}\) 为

其中 \(R\) 为绝对气体常数，\(N\) 为每克当量中"真实分子"的数量，\(T\) 为绝对温度。由于动能和势能的时间平均值，能量 \(\bar{\varepsilon}\) 是单个自由气体分子动能的 \(2/3\)。即使某些因素（如辐射过程）导致谐振子的时间平均能量偏离 \(\bar{\varepsilon}\) 值，通过与自由电子和气体分子的碰撞，其平均能量会通过吸收或释放能量恢复至 \(\bar{\varepsilon}\)。因此，在此情况下，只有当每个谐振子均具有平均能量 \(\bar{\varepsilon}\) 时，动态平衡才能存在。

我们现在将类似的考虑应用于谐振器与腔内环境辐射之间的相互作用。对于这种情况，普朗克推导出了动态平衡的必要条件；[2] 他将辐射视为完全随机的过程。[3] 他发现：

\[ \bar{\varepsilon} = \frac{L^3}{8\pi} \frac{1}{\nu^2} \frac{\rho_\nu}{d\nu} \]

这里，\(\bar{\varepsilon}\) 是固有频率为 \(\nu\) 的谐振子的平均能量（每个振动分量），\(L\) 是光速，\(\nu\) 是频率，\(\rho_\nu d\nu\) 是频率介于 \(\nu\) 和 \(\nu + d\nu\) 之间的腔体辐射能量密度。若频率为 \(\nu\) 的净辐射能量不持续增加或减少，则必须满足以下等式：

动态平衡的这一条件不仅与实验不符，还消除了物质与以太之间任何平衡的可能性。谐振器频率范围选择得越宽，空间中的辐射能量就越大，最终我们得到：

普朗克对基本量子的推导

在下一节中，我们将证明普朗克先生对基本量子的确定在某种程度上独立于他所创立的“黑体辐射”理论。普朗克[4]给出的关于\(\rho_\nu\)的公式，迄今为止足以解释所有实验。

在 \(T/\nu\) 值很大的极限下，即对于大波长和高辐射密度，该公式趋近于以下形式：

可以看出，这个公式与从麦克斯韦理论和电子理论推导出的公式相同。令公式中的系数相等：

即一个氢原子重 \(1/N\) 克 \(= 1.62 \times 10^{-24}\,\text{克}\)。这正是普朗克先生所求得的值，与其他方法获得的结果吻合良好。由此我们得出结论：辐射的能量密度和波长越大，我们所采用的理论基础就越适用；但对于短波长和低辐射密度的情况，该基础则完全失效。

以下将根据经验来考虑“黑体辐射”，而不对辐射的产生与传播过程形成具体图像。

辐射的熵

以下讨论包含于维恩先生的一部著名著作中，此处仅出于完整性考虑加以收录。设辐射占据体积\(v\)。我们假定，当所有频率的辐射密度\(\rho(\nu)\)给定时，辐射的可观测性质便完全确定。[5]由于可将不同频率的辐射视为可分离的（无需做功或传热），辐射的熵可表示为如下形式：

其中 \(\phi\) 是变量 \(\rho\) 和 \(\nu\) 的函数。通过表达反射壁间辐射的熵在绝热压缩下不变，可将 \(\phi\) 简化为仅含一个变量的函数。然而我们暂不深入探讨这一点，而是直接研究如何从黑体辐射定律中得出函数 \(\phi\)。

在“黑体辐射”的情况下，\(\rho\) 是 \(\nu\) 的一个函数，使得对于给定的能量，熵取最大值，即

与 \(\nu\) 无关。对于体积 \(v = 1\) 的黑体辐射温度升高 \(dT\)，以下方程成立：

\[ dS = \int \frac{\partial \phi}{\partial \rho} \frac{\partial \rho}{\partial T} d\nu\, dT \]

\[ \frac{dE}{T} = \int \frac{\partial \phi}{\partial \rho} \frac{\partial \rho}{\partial T} d\nu\, dT \]

这就是黑体辐射定律。因此，可以通过函数\(\phi\)来确定黑体辐射。反之，通过积分可以从黑体辐射定律推导出\(\phi\)，同时需注意当\(\rho = 0\)时\(\phi\)为零。

低辐射密度下单色辐射熵的极限定律

诚然，迄今为止对"黑体辐射"的观测表明，维恩先生最初为"黑体辐射"提出的定律并非完全有效。然而，对于较大的\(\nu/T\)值，实验完全证实了该定律。我们将基于此公式进行计算，同时谨记其结果仅在特定限制条件下有效。

\[ \phi(\rho, \nu) = -\frac{\rho}{b\nu} \ln \left( \frac{\rho}{a\nu^3} \right) \]

设有一辐射能量 \(E\)，其频率介于 \(\nu\) 与 \(\nu + d\nu\) 之间。设该辐射占据体积 \(v\)。此辐射的熵为：

我们将仅限于研究辐射熵对其所占据体积的依赖性。设辐射占据体积\(v_0\)时的熵为\(S_0\)，则有：

该方程表明，足够低密度的单色辐射的熵随体积变化的规律，与理想气体或稀溶液的熵变规律相同。下文将依据玻尔兹曼先生提出的原理——即系统的熵是其状态概率的函数——对刚推导出的方程进行诠释。

气体和稀溶液熵的体积依赖性的分子理论研究

在基于分子理论计算熵时，“概率”一词常被用于一种未被概率论定义所涵盖的含义。特别是“等概率情形”往往通过假设设定，而实际应用的理论表述已足够明确，无需通过假设固定概率即可推导出概率。我将在另一项工作中证明，在处理热过程时，利用所谓的“统计概率”可得到完整结果。通过这种方式，我希望消除阻碍完全实现玻尔兹曼原理的逻辑困难。然而，此处仅给出其一般性表述及在特定情形下的应用。

当讨论系统状态的概率有意义时，并且每个熵的增加都可以描述为向更可能状态的转变，系统的熵 \(S_1\) 是其瞬时状态概率 \(W_1\) 的函数。对于两个系统 \(S_1\) 和 \(S_2\)，可以表述为：

若将这些系统视为一个具有熵 \(S\) 和概率 \(W\) 的单一系统，则：

后一个方程表示两个系统的状态是独立的。由这些方程可得：

常数 \(k\) 也是一个普适常数；它源于气体动力学理论，其中常数 \(R\) 和 \(N\) 的含义与上文相同。若将某一特定初始状态的熵记为 \(S_0\)，并将熵为 \(S\) 的状态的相对概率记为 \(W\)，则一般有：

现在我们考虑以下特殊情况。设体积 \(v_0\) 中存在若干（\(n\) 个）可移动的点（例如分子），这些点将成为我们讨论的对象。除此之外，还可以存在任意多个其他可移动的点。关于这些被考虑的点在空间中如何运动的规律，唯一的假设是：空间的任何部分（以及任何方向）都不比其他部分更受偏爱。我们所考虑的（首先提到的）点的数量非常少，以至于它们之间的相互作用可以忽略不计。所考虑的系统（例如理想气体或稀释溶液）具有特定的熵。

我们从体积 \(v_0\) 中取一部分大小为 \(v\) 的容积，并设想所有 \(n\) 个可移动点都位移到该容积 \(v\) 中，系统的其他部分保持不变。显然，这一状态具有不同的熵（\(S\)），而我们希望借助玻尔兹曼原理来确定该熵差。问题在于：相对于原始状态，最后提及的状态的概率有多大？或者说，在某一时刻，体积 \(v_0\) 中所有 \(n\) 个独立运动的点偶然全部落入体积 \(v\) 的概率是多少？

值得注意的是，对于这一推导过程——从中可以轻松通过热力学推导出玻意耳-盖吕萨克定律和相同的渗透压定律[6]——无需对分子运动方式做出任何假设。

用玻尔兹曼原理解释单色辐射熵的体积依赖性

在第4段中，我们得到了单色辐射熵对体积依赖关系的表达式：

将此与表达玻尔兹曼原理的一般公式进行比较，我们得出以下结论：如果频率为\(\nu\)、能量为\(E\)的单色辐射（通过反射壁）封闭在体积\(v_0\)中，那么在任意时刻，位于体积\(v_0\)的一部分\(v\)中的所有辐射能量的概率为：

随后我们得出结论：在热理论中，低密度单色辐射（在维恩辐射公式的有效范围内）的表现仿佛由大小为 \(\frac{R}{N} \nu\) 的独立能量量子组成。

我们还希望比较“黑体辐射”能量量子的平均大小与同温度下分子质心运动的平均能量。后者为\(\frac{3}{2} (R/N) T\)，而维恩公式给出的能量量子平均能量为：

单色辐射（在足够低的密度下）在熵对体积的依赖关系上，表现得像是由大小为 \(R\nu/N\) 的能量量子组成的非连续介质，这一事实提示我们应当探究：如果光确实由这样的能量量子构成，那么光的产生和转化定律是否必然如此。接下来我们将探讨这一问题。

斯托克斯定律

设单色光通过光致发光转化为另一频率的光，并假设根据刚刚得到的结果，生成光与生成的光均由大小为 \((R/N) \nu\) 的能量量子构成，其中 \(\nu\) 为对应频率。该转化过程可解释如下：每个频率为 \(\nu_1\) 的生成能量量子被吸收，并在生成能量量子密度足够小的情况下，自行产生一个频率为 \(\nu_2\) 的光量子；同时可能产生其他频率（如 \(\nu_3, \nu_4\) 等）的光量子以及其他形式的能量（例如热能）。最终结果通过何种中间过程实现并不重要。

如果光致发光物质不是连续的能量源，根据能量原理，产生的能量量子的能量不会大于激发光量子的能量；因此必须满足以下关系：

众所周知，这是斯托克斯定律。尤其值得注意的是，在弱光照条件下，其他条件相同时，产生的光量必须与激发光量成正比，因为每个入射能量量子都会引发上述类型的一个基本过程，且不受其他激发能量量子作用的影响。特别地，激发光强度不存在下限，低于此限度的光将无法激发荧光。

根据此处对现象的理解方式，在以下情况下可设想偏离斯托克斯规则：

最后提到的可能性值得特别关注。根据现有的理解，不能排除在维恩定律的有效范围内，“非维恩辐射”即使在高度稀释的情况下，其能量行为也可能与“黑体辐射”不同。

关于固体受光照产生阴极射线的研究

通常认为光能量在传播空间中连续分布的理解，在试图解释光电现象时会遇到极大的困难，正如莱纳德先生在其开创性论文[7]中所阐述的那样。根据激发光由能量为\((R/N)\nu\)的量子所构成的理解，光产生阴极射线的过程可作如下构想。

能量量子穿透固体的表层，其能量至少部分转化为电子的动能。最简单的图景是：一个光量子将其全部能量传递给单个电子；我们假设这种情况会发生。然而，不能排除电子仅部分接受光量子能量的可能性。一个获得动能的电子在到达表面时会损失部分能量。除此之外，我们必须假设每个电子离开固体时都需要做功 \(P\)（该固体的特征值）。

位于表面正上方的电子，若以垂直于表面的方向被激发，将以最大的法向速度离开固体。此类电子的动能为

若物体被充电至正电势 \(\Pi\)，且周围导体电势为零，且 \(\Pi\) 恰好足以防止物体漏电，则必有：

其中 \(E\) 是单价离子一克当量的电荷，\(P'\) 是该负电量相对于该物体的电势。[8] 若设 \(E = 9.6 \times 10^3\)，则 \(\Pi \times 10^{-8}\) 为该物体在真空中受到照射时所达到的电势（以伏特为单位）。

为检验推导关系是否与实验在数量级上一致，我们设 \(P' = 0\)，\(\nu = 1.03 \times 10^{15}\)（对应太阳光谱的紫外极限），以及 \(h = 4.866 \times 10^{-27}\)。得到 \(\Pi \times 10^7 = 4.3\) 伏特，这与勒纳德先生的结果[9]在数量级上相符。

若推导出的公式正确，则\(\Pi\)作为激发光频率的函数（以笛卡尔坐标表示）必为一条直线，其斜率与所研究物质的性质无关。就目前所见，我们的理解与勒纳德先生观测到的光电效应特性之间并无矛盾。

若激发光的每个能量量子独立地向电子释放其能量，则电子的速度分布（即所产生阴极射线的性质）将独立于激发光的强度；而在其他条件相同的情况下，离开物体的电子数量将与激发光的强度成正比。[10] 我们预期，这些规则的有效性边界在本质上将与斯托克斯定律的预期偏差相似。

在前文中，我们假设产生光的能量量子中至少有一部分能量完全转移给了单个电子。若不基于这一自然假设，则上述方程应替换为：

对于阴极发光，这构成了刚才所考察过程的逆过程，通过类似的考虑可得：

对于勒纳德先生所研究的材料，\(P e\) 始终显著大于 \(h\nu\)，因为阴极射线为产生可见光所需穿越的电压在某些情况下为数百伏，在其他情况下则达数千伏。[11]

紫外线对气体的电离作用

我们必须假设，在气体被紫外线电离的过程中，一个吸收的光能量量子总是用于电离一个气体分子。由此首先得出，一个分子的电离能（即理论上电离所需的能量）不可能大于一个吸收的光能量量子的能量。设 \(J\) 为每克当量的（理论）电离能，则有：

根据莱纳德对空气的测量，产生效应的最大波长约为 \(1.9 \times 10^{-5}\,\text{cm}\)。

电离能的上限也可以通过稀薄气体中的电离电压获得。根据Stark[12]的结论，在空气中测得的最小电离电压（使用铂阳极）约为10伏特[13]。因此，我们得到\(J\)的上限为\(9.6 \times 10^{12}\)，这与刚才得出的数值几乎相同。

我认为还有另一个非常重要的结果需要验证。如果每个光能量量子电离一个分子，那么吸收的光量 \(L\) 与由此电离的克分子数 \(j\) 之间必须存在以下关系：

如果我们的理解反映了现实，那么对于每一种（在特定频率下）没有吸收且不伴随电离的气体，这一关系必须成立。

权利说明：以上英文文本是爱因斯坦1905年论文的维基文库译本，注明为公共领域作品（包括原文和译文）。