这是转自北相的帖子, 供大家讨论。徐建民:我理解的相对论编者按: 这是徐建民律师在北相甲子战略学术报告会上的论文,现在公布如下,希望大家能够进行评论,并且结合自己的情况,谈谈对于爱因斯坦相对论的看法,也希望能够回答吴水清会长在元旦讲话的问题,一并发到北相总部信箱:gnswusq@163.com;gnswusq@sina.com 狭义相对论
为什么要修正牛顿力学?在伽利略变换下,牛顿力学定律在任何惯性系下保持不变。但是,麦克斯韦方程却不符合伽利略相对性原理,也就是说在一个惯性系下的麦克斯韦方程,到了另一个匀速运动的参考系下麦克斯韦方程就变成另外一种形式了。而在当时普遍认为伽利略相对性原理是定律的定律,也就是说任何定律只有符合伽利略相对性原理才能称其为有效的定律。按着这样的要求,麦克斯韦方程就是个错误的理论。但是大量的实验证明它没有错。可是如果它没错,就应当有一个适应光速不变的绝对参考系,即以太的存在,才能解释它的协变问题。但是作为寻找以太的迈克尔逊-莫雷实验却令人失望,这个实验似乎表明绝对静止的以太根本不存在。这样的实验结果,就像一朵乌云笼罩在物理学的上空,物理学界左右为难。在这种情况下,爱因斯坦提出一个大胆的想法,麦克斯韦方程并没有错,错的是伽利略变换,用一个新的变换取代伽利略变换,并且对牛顿力学进行适当的修正,就可以解决全部问题。
既然爱因斯坦仅仅将牛顿的绝对时空改为相对时空就协调了牛顿力学和麦克斯韦方程。那么什么是绝对时空和相对时空呢?我通过一个例子解释一下。
接下来我们要讨论一下光速不变原理。爱因斯坦为什么要把光速不变上升为原理呢?这有三个理由:一是,狭义相对论的目的就是协调牛顿力学和麦克斯韦方程的,而麦氏方程中的光速是常数,所以狭义相对论必须是光速不变的。二是,时空相对性的前提是光速不变。我们说太阳上的时钟与地球上的时钟相比差8分多钟,就是以光速衡量的,如果光速是变的,8分多钟的时间差就没有根据了。三是,将光速不变上升为原理是为了解决物理学中的一个陷阱。什么是原理,我们都学过欧几里得几何原理,原理就是不需要证明的,是第一性的。为什么爱因斯坦将光速不变上升为原理呢?我们先来分析一下光速不变在狭义相对论中起到什么作用。为了证明时空的相对性,必须要校准不同位置的钟,要校钟就得有个标准,这个标准就是光速,假如光速是随时变化的,这钟就没办法校准了。现在出现了一个麻烦的问题。为了测量空间不同点的时间,我们就必须检验钟从一点移到另一点后是否还保持同步,为检验同步又需要光的速度,而为测量光的速度又不得不测量空间不同点的时间。这是个陷阱。要想不掉进这个陷阱就必须将光速不变上升为原理,也就是光速不变是第一性的,不要再去证明了。 我顺便提一下,很多人认为光速不变是爱因斯坦提出来的,推翻了光速不变就推翻了狭义相对论。我觉得前面的一句话不对,后面的一句话是对的。其实光速不变在狭义相对论出现之前早就存在,与其说是爱因斯坦提出了光速不变还不如说是他被动地接受了光速不变。甚至他对光速不变还产生过怀疑。爱因斯坦在16岁的时候做了个思想实验。如果光速与一般的匀速运动一样的话,那么骑在光上的人会感觉到光是停滞不前的,但是无论从经验上还是从麦克斯韦方程的表现上,这种现象不可能存在。所以要么是光速不变错了即麦氏方程错了,要么是光速不变本身包含着一个更大的秘密没有被揭开。显然这个秘密就是狭义相对论。为什么说后一句话是对的呢?的确是,如果光速不变被推翻,全部相对论大厦就倒塌了,其实还不止相对论,麦克斯韦方程、量子力学和量子电动力学都将会是个不能成立的理论。 最后我们再谈谈狭义相对论的成果及实验验证。我在前面说了,使牛顿力学与麦氏方程协调一致使其都能在惯性系下保持不变是狭义相对论建立的真正目的所在,所以这个果是正果。而运动的物体质量增加、能量动量,质量守恒和质能等价关系式,是它的副产品。之所以上述是副产品,就是你只要承认牛顿力学必须服从洛伦兹协变,这些东西自然而然地就产生出来了。比如牛顿力学中,动量是守恒的,但是经过洛伦兹变换后的动量不守恒了,要使其仍然守恒就必然推出惯性质量随速度而变的结论。尽管是副产品,但是这些成果还是相当重要,在量子力学,尤其是量子电动力学产生和发展方面起到了非常重要的作用。 对狭义相对论上述结论的验证有两类。一类是通过直接实验检验的,如1909年布赫勒(A.H.Bucherer,)做的电子在磁场中旋转质量增加的实验。康普顿效应中的电子的能量动量质量守恒关系的验证。另一类是对已有的现象用狭义相对论进行解释。如U子从太空到地球运动距离缩短和时间膨胀的解释。迈克尔逊-莫雷实验的解释。我这里只对最后一个即迈莫实验做一些讨论。因为它太重要了,它当时是被狭义相对论驱散了的漂浮在物理学上空的一朵乌云。 1887年迈克尔逊和莫雷做了一个著名的实验,用以确定地球通过一种假设的以太时的绝对运动。该实验是这样设想的,地球在围绕太阳的公转轨道方向上有一个速度,这个速度是基本确定的,在与公转轨道垂直的方向上没有速度,于是从光源发出的黄色光被半镀银镜分成两束,其中一个光束在地球公转轨道方向走一个来回,另一光束在垂直地球运动方向上走一个来回,因为地球两个方向的速度不同就必然导致两束光之间到达检测点有时间差,这个时间差必然使两束光产生干涉。他们预期实验中的干涉条纹的移动量为0.04个条纹,但是实际上却未观察到上述干涉条纹的移动。为什么干涉条纹移动是零结果呢?洛伦兹对此做出的解释是:如果假定物体在运动方向(即地球公转轨道方向)的长度收缩洛伦兹因子倍,就可以解释实验零结果。 洛伦兹同时认为这种收缩是物体内部的分子力引起的,是一种动力学效应。后来实验检验物体没有这种收缩。而狭义相对论对迈莫实验的解释是:在静止参考系上的观察者认为运动的物体在运动方向上是收缩的,它的确有收缩,也就是说对于一个与地球一起运动的坐标系而言没有收缩,但对于相对于太阳保持静止的坐标系而言,这个镜子系统的确有收缩,收缩的倍数仍然是洛伦兹因子倍。这个意思是说只有与太阳相对静止的观察者才能看到没有干涉即零结果,可是这个零结果却被与地球相对静止的观察者看到了。这不是很奇怪吗? 广义相对论广义相对论的逻辑基础或它的物理内容并不难,难的只在数学上,是数学拔高了它的难度。我们还是先来概括一下广义相对论建立和发展的整体脉络。 与狭义相对论不同的是,广义相对论是一个独立的动力学理论,它所讨论的就是引力场。目标有两个:其一,将狭义相对论的自然定律在一切惯性系下不变的狭义相对性原理推广到自然定律在任意参考系下不变的广义相对性原理。其二,将这个原理应用到引力场中,引力场是这个原理的第一块试验田。达到这两个目标的方法:通过加速度与引力场等效原理得出广义相对性原理;通过度规与时空的相互关系解决引力场的结构问题;通过马赫原理解决惯性场问题;最后得出来的结论是:引力场就是时空弯曲,曲率越大场越强,建立了时空曲率与能量动量对应关系即爱因斯坦方程。 牛顿力学虽然经过狭义相对论的修正,但是并没有摆脱其受到惯性系的制约,它还仍然存在以下三个不能令人满意的地方:一是不可能找到一个绝对的惯性系,地球是惯性系吗?显然不是,它在围绕太阳公转,也在自转。太阳是惯性系吗?银河系是吗?显然都不是。我们之所以有时把它们作为惯性系看待,是因为它们运动的缓慢,参考它不至于对我们要计算的结果有太多的偏离。没有绝对的惯性系就意味着牛顿力学的逻辑基础是不牢固的。二是牛顿力学在非惯性系中无效。三是牛顿力学存在一个逻辑陷阱:力是什么?力是使具有一定惯性质量的物体参照惯性系产生加速度的东西;惯性系是什么?它是一个不受外力作用的牛顿力学在其上有效参考系,那外力的作用又是什么,又回到出发点。这样的缺陷在爱因斯坦看来是不可容忍的。于是他提出广义相对性原理:自然定律在任意参考系下都有效。 如何才能使自然定律在任意参考系下都有效呢?我们知道,牛顿第一定律是说除非有外力作用否则物体将保持其静止或匀速直线运动。这里的含义是匀速直线运动与静止对于牛顿力学来说是一样的。你既可以说物体A是静止的,物体B相对于A做匀速直线运动,也可以说物体B是静止的,A是相对B做匀速直线运动的。也就是说我们可以通过一个匀速直线运动使另一个匀速直线运动静止。同样我如果认为A物体在加速运动,我也可以认为A是静止的,但是在加速度的方向上有个引力场存在。也就是我们可以通过一个引力场使另一个加速运动静止。这听起来好像还很抽象,我们用比萨斜塔实验再加以说明。伽利略的比萨斜塔实验是说,从斜塔上扔下一顿重的石头与一公斤重的石头,在空中(严格讲是真空)的加速度都一样,也就是物体的加速度与物体的质量无关。但是这与牛顿第二定律是矛盾的,牛顿第二定律是说,物体的加速度与物体的质量成反比,当力给定的时候,物体越重产生的加速度就越小。也就是重物比轻物更难加速。一吨重的石头与一公斤重的石头加速度不可能一样。是斜塔实验错了还是牛顿第二定律错了?我们很清楚两个都没错,我们必须调和它们之间的矛盾。如果要使它们两个都没错唯一可能的解释是,从比萨斜塔下来的石头并没有加速,是静止在那里的,而是地球在向石头加速。有人会说这怎么可能呢?明明是石头加速,怎么可以说它静止呢?你现在是站在地球上看斜塔掉下来的石头,假如你坐在石头上,你就会感觉是地球向你靠拢。这就向你坐在一列停在车站的火车上,在你旁边的一列火车加速运动,你感觉是你坐的火车起动了一样。还是斜塔的例子,同样,你既可以认为石头静止,地球在加速,也可以认为,地球也没动,而是在石头周围有个指向地球引力场。为了说明这个问题我再举个例子。在皮影戏里,你可以让背景不动,而让人物加速向前跑,你也可以让有白云绿树的背景向后倒,显示出人物穿过云层加速飞翔。引力场就是这个背景,石头就是人物。正是基于这样的考虑,爱因斯坦提出了加速度与引力场等效原理。有了这个原理后,惯性系就是一个不必要的假设了,物理定律不再受惯性系的束缚,使其在任何参考系下都有效。 广义相对性原理不仅仅是引力场的,应当是全部物理学的原理,爱因斯坦只是把引力场作为广义相对性原理植入的第一块试验田。如果加速度与引力场等效成立的话,那就意味着,过去在牛顿力学中讨论的物体(质点)的位置随时间的变化规律,比如由外力作用产生物体的加速运动的轨迹,现在就变成了讨论物体的背景场的结构了。下面我们看植入广义相对性原理后的引力场的结构是什么样的。 广义相对论中的最重要的两个概念是:度规和时空弯曲,我们只要详细的理解这两个概念及其关系,就基本上知道引力场的结构了。 度规,从字面上你干脆就理解它为一个用来度量的圆规,或是一把尺。它不是实物的尺和圆规,而是一个函数尺,它自身也在变化。这把尺是怎么起作用的呢?我们举个例子来说明之。还是狭义相对论中列车上丢苹果的例子。与狭义相对论的匀速运动的列车不同,这次列车是加速行驶的,列车上的一个人从车窗向外扔一个苹果,车上的人看到这个苹果运行的轨迹是弯曲的,路基上的人看到的苹果运动轨迹比匀速运动火车掉下来的苹果运动轨迹更弯曲。路基上的人认为列车上的时空与自己是不同的,但是他要想知道列车上发生掉苹果的点(事件)的时空,他就需要以自己的钟和尺(时空)为基点乘上洛伦兹因子,不过这个洛伦兹因子应当修改为:根号内分子上的速度平方改为引力势或加速度与空间间隔的乘积。这个新的洛伦兹因子就是度规(弱引力场下的)。有人会说你这里举的例子是加速度,看起来不是引力场,我怎么知道度规与时空在引力场是什么样子呢?其实你大可以放心,因为加速度与引力场等效,这样的度规和时空也一定符合引力场。我们现在需要做一个抽象的思维。在你的脑海中把上述例子中的列车、苹果和路基统统拿掉,只剩下扔苹果的那个点和路基上站着观察者脚下的点,这两个点的时空不同。这两个点可以无限接近,在地球和太阳之间到处都有这样的点,这就是引力场。如果还不能理解引力场与时空的关系,我们再举一个例子。我们用费曼使用过的一个例子。有这样一个很大的圆形石板,在石板的中心下面有一堆火,由于火在石板的中心,所以,石板中心最热,依次向外温度降低,整个石板上形成从中心到边缘的温度梯度。而在石板的不同半径上形成很多等温环,不同环上的温度不同。现在,在每一个环上都放一把尺,由于热胀冷缩,每个环上的尺的长度变的都不一样了,最中心的尺最长,最外沿的尺最短。我们知道环与环之间有温度梯度就一定有一个温度势,假如我们对温度势随空间的变化规律是了解的。那么,我就可以在某个环的温度为已知的条件下,通过等温势得出下一个等温环的温度。现在我们就可以用这个例子与引力场做类比了。整个石板就是个引力场,等温环就是等势面,环与环之间的尺长不同就是时空不同,温度势就是引力势就是度规。而石板中心下面的一堆火就是一个天体(质量)。从天体的质量可以推出度规的变化规律,通过度规和某个已知时空就可以推出下一个时空。所以,度规与时空的关系是:度规决定时空,时空影响度规。
下面我们解释一下时空弯曲的含义。我们从两个不同层面上来理解时空弯曲。首先从经典力学中物体运动的轨迹来类比,看看时空弯曲的含义是什么。我们知道,在牛顿力学中如果一个物体的运动速度不变,也就是物体匀速运动,那么物体运动的轨迹就是直线的。而如果物体运动的速度是变化的,那么通常物体运动的轨迹就是弯曲的(也有直线加速的情况,但是在引力场中不可能有直线加速运动)。我们可以与上述做一个类比,如果在某一个区域每一点的时空不变,都是相同的,或者说在这个区域中的钟的速率和尺的长度都完全一样,我们就说这个区域的时空是平直的,否则,如果某区域的每一点时空不同,我们就说这个区域的时空是弯曲的,这就是时空弯曲的含义。另外我们还可以从逻辑关系层面来理解时空弯曲。如果你承认等效原理是正确的话那么时空弯曲就是它逻辑上的必然结果。这个意思就是说,等效原理使得过去在牛顿力学中认为平坦时空(绝对时空)和物体在平坦时空的背景中的加速度(弯曲的轨迹),现在替换为弯曲的时空(引力场)和在这个时空中"静止或直线运动"的物体。 下面我们谈一下马赫原理。惯性的起源一直是个谜。将牛顿定律用在非惯性系中,就会产生一个惯性力,这个力通常认为是虚假的,因为它没有源。牛顿通过三个水桶证明惯性来自于与绝对空间之间的相对运动。马赫对此进行了批评,他认为惯性来自于所考虑的物质粒子与所有(整个宇宙)其他粒子之间的相互作用。爱因斯坦不可能同意牛顿的所谓的有一个绝对空间的存在。而认为惯性来源于物质之间的相互作用是符合他一贯坚持的理念的。所以爱因斯坦给马赫的说法以肯定,并将其上升为原理。在爱因斯坦自由降落的升降机内部的局域惯性系的存在正是惯性场与引力场抵消的结果,所以广义相对论是不可能回避惯性的。但是广义相对论建立后,马赫原理遭到很多人的批评,尤其是它存在的瞬时超距作用遭到多人的诟病。如果一个粒子加速瞬间就有一个惯性存在,而按着马赫的说法,这惯性来源于所有其他物体,包括那遥远的星系的相互作用,那么这就会产生超光速的瞬时性。所以,爱因斯坦晚期也不坚持这个原理的有效性了。 下面我们再来谈谈爱因斯坦场方程和运动方程。首先是场方程,任何人都会同意这样的观点,时空和度规都不是凭空而来的,一定有一个使它存在和变化的原因。爱因斯坦认为这个原因就是质量、能量和动量。因此,毫无疑问爱因斯坦方程的等号两边,一边是质量、能量和动量,另一边是度规作用下的时空。爱因斯坦仿照泊松方程建立自己的方程。因为加速度与引力场等效,而加速度是时间的二阶导数,所以爱因斯坦方程也是二阶的。 通俗一点,如果我把某事件的时空点设定为1,以它为标准,使用度规测得另一个时空点为1.1,那么由1.1-1=0.1,这0.1就是时空弯曲的曲率,这个数的大小决定于能量动量和质量。这个数越大场越强。我们知道弯曲的线总比直线长,这长出来的正是场本身。我这里引用费曼对爱因斯坦场方程的最简单解释: 半径的超出量=半径的测量值-半径的预期值=GM/3c2 这里的G和M分别是牛顿引力常数和球面内的物质的质量,C是光速。半径的超出量就是曲率,注意,这样得出来的曲率是平均曲率。 下面再讨论一下爱因斯坦的运动方程。我们知道牛顿运动学方程可以表述为:粒子总是沿着一条最小作用量的轨迹运动,这也称为最小作用量原理。广义相对论也有这样的原理。广义相对论认为时空是弯曲的,物体在这个弯曲时空中,极力地要沿着"直线"运动。这里的直线不是通常的直线,可以这样理解,物体极力地寻找弯曲度小的地方运动。广义相对论中与"最小作用量"相对应的是"原时最长"。爱因斯坦运动方程可以表述为:粒子总是沿着一条原时最长的轨迹运动。什么是原时呢?就是固定在粒子上的时钟所走过的时间。或者说是观察者背着的钟所测量的时间。为什么"原时最长"成为广义相对论的最小作用量原理呢?我们知道,在闵可夫斯基四维空间间隔中时间的前面是个负号,所以时间越长,时空间隔就越小,粒子总是走一条最短距离的路径,就意味着走一条最长时间的路径。这在广义相对论中也是一样的。 最后,根据爱因斯坦的两个方程我们用一句话总结度规、时空、物质和运动的关系:时空告诉物质怎样运动,物质通过度规告诉时空怎样弯曲。
最早验证光线弯曲的是英国天文学家艾丁顿,很多人怀疑他在1919年的实验结论有造假的嫌疑。我倒觉得如果光线在引力场中不弯曲的话反而值得怀疑了。
|