对于教材写法的一点考虑
有感于Matrix67神牛的这篇文章(强烈建议大家去读一读),我也发表一下自己对于教材编写的一点看法。
1.对线性代数的吐槽
(没学过线性代数的同学请忽略下面3段往后接着看。)
我一直觉得线性代数用那种严格公理化的语言写成课本根本不适合初学者学习,一开始学习线性代数的时候,我本人对很多概念的直观意义根本就是完全不知道。我们的课本是丘维声的《简明线性代数》,我在此毫不掩饰的表示对这本教材的鄙视:这本教材居然是按照这样的顺序讲线性代数的:线性方程组->行列式->线性方程组的进一步讨论->矩阵的运算->一大堆东西->线性空间->线性映射->一大堆东西。这个狗屁顺序直接导致我前半个学期一直以为线性代数就是研究怎么解线性方程组的,我心想,这么简单的问题,具体问题谁都会解,值得这么大动干戈的定义出这么大堆东西么。。。一直到线性空间那一个章节以前,我完全就不知道线性代数整个是在干什么..后来学的多了我才知道,其实线性代数就是研究线性空间和线性映射的嘛,什么线性方程组,根本没那么重要。一个更加合理的顺序是:先讲线性空间、线性映射,其中明确说明矩阵就是线性映射,然后再讲行列式,然后线性方程组只作为一个例子出现就可以了。
然后在说说那个不靠谱的行列式。。我就不明白,国内的教材是基于怎样一种考虑,居然把行列式放在矩阵前面讲,放在线性映射前面讲。?于是就导致行列式的定义居然诡异的用到了逆序对,一上来就来这么个定义我们怎么可能明白行列式到底是个什么东西,它是干什么的?!还有矩阵的概念,我们的课本引入矩阵是从线性方程组引入的,于是让我在前半学期里面就仅仅以为矩阵就是一堆排成了方阵的数而已。。。于是我就死活不能理解,为什么矩阵之间还能引入乘法,乘法的定义还能那么诡异?!非要等到后面学到了线性映射,我们老师才终于跟我们讲清楚了:原来矩阵就是用来表示线性映射的嘛。。矩阵相乘就是表示先后做两个线性映射嘛,之所以那么定义矩阵乘法,就是因为这样定义了之后,乘得的新矩阵确实能够等价的表示先后做两次线性映射。。。但是行列式到底是什么,课本根本就到最后都没有说清楚。还是Matrix67文章里的一句话道清了本质:“其实,行列式的真正定义就一句话:每个单位正方形在线性变换之后的面积”。为什么所有的教材里就不能把这样一句话放在教材里呢?!
还有很多概念都没有讲清楚它们的直观意义到底是什么。有许许多多学经济或者学其他学科的同学,可能学完了整个线性代数也不明白,算特征值和特征向量到底是干什么的,为什么要研究这么诡异的问题。如果不是我们老师上课讲道它在量子力学里会体现出无穷重要的价值,我单看课本肯定不明白这是在干什么。特征值其实就是量子力学里的算符对应的可观测物理量(这点可能不学量子力学很难理解)。还有就是迹(trace)的概念,我至今没有搞清楚为什么要定义这么一个量,我根本就不知道它表示了什么。于是我就既记不住它的各种性质,也不知道我到底在何种物理问题里会用到迹这个诡异概念。你说我都完全不理解到这个地步了,学这个概念还有什么用?不光是我一个人的问题,我问了问身边的人,他们同样回答不出来迹是个什么。
国内好多同学应该都会对此有共鸣,因为我们国内的教材都是这样对概念只下严格数学定义,而基本上不作直观解释的,于是就导致很多很多人学完了线性代数都不知道自己学了些什么。理解数学概念的直观图像,其作用不仅仅是能够帮助记忆那些概念的性质,甚至可以帮助捋出证明思路,甚至都可以帮助数学家发明新的数学。可是现有的课本就是讲不清楚直观解释!
2.对理论力学的吐槽…
最小作用量原理与物理之美5——对称守恒与作用量
作用量的形式变幻多端,有人曾问过我我们是怎么知道作用量的表达式的。我想说的是,人类还没有一套完整的直接写出不同领域的作用量的方法,但是利用物理定律的对称性人们可以更容易得找到正确的作用量。物理定律的对称性和平常所说的几何对称还稍有不同,我来简单介绍一下吧。
对称的定义要点是这样的:如果有一样东西,我们可以对它做某种事情,在做完之后,这个东西看起来依旧和先前一样,那它就是对称的(见《费恩曼物理学讲义 第一卷》第52章)。比如我们熟悉的轴对称图形,我们把它经过镜面反射,它看起来和原来一样,因此它就是对称的。
作用量的对称性就是物理定律的对称性。对于物理定律来说,他们应该满足一些对称性。例如,F=ma这样的定律,我们在实验室做实验、在海底做实验、在外太空作实验都可以得到,不会在哪里发现F=2ma或者F=m^2*a。我们称这些物理定律满足空间平移对称。物理定律还满足时间平移对称,我们一百年以前做的实验发现的定律,现在再做还会发现同样的定律,一百年以后依然如此,物理定律的形式不随时间的流逝而改变,就称这些定律满足时间平移对称。还有一个比较普遍的对称称为空间旋转对称,即我们无论脸朝着哪个方向看到的物理定律都应该都是相同的。以上三个对称性,是适用于所有物理定律的,至今没有发现任何物理定律例外。…
最小作用量原理与物理之美4——构建整个世界
有人曾经问过我有没有一个公式可以描述整个世界,我的回答就是,可能会有,这个定律很可能就是最小作用量原理。《可怕的对称》生动地说道:整个宇宙的终极设计可以写到一张餐巾纸上,那一行紧凑的公式可以推导出所有物理定律。而那张餐巾纸上写的,其实就是作用量S的表达式。我们前面看到了S在几何光学中的特例,也看到了他在经典力学中的特例。终极设计的S中一些量为常数,就可以退化成各种各样的特例。在电磁学、热学、相对论、量子力学中,S也有各自的退化形式。而一旦终极设计的S中的所有项我们都弄清楚了,我们也就可以自豪地宣称我们理解宇宙了。可惜我们离这个梦想还差得很多。
当年20世纪初的时候,物理学大厦貌似被全部推翻了,似乎一切旧的理论都被新的理论所取代了。但是,“在如此多的废墟中间,还有什么东西屹立长存呢?最小作用量原理迄今未经触动,人们似乎相信他会比其他原理更久长。事实上,它是更加模糊,更加抽象。”庞加莱(Poincaré)(又被翻译成彭加勒)如是说。他还说道:“作为普遍的原理,最小作用量原理和守恒原理具有极高的价值,他们是在许多物理定律的陈述中寻求共同点时得到的,因此,他们仿佛代表着无数观察的精髓。”确实,很难想象最小作用量原理会被推翻,因为在最小作用量原理之外我们想不到还有什么更普遍而真实的原理了。现代物理已经全部构建在最小作用量原理之上,如果发现最小作用量原理不成立了,那可以说整个物理就没有什么对的东西了。…
最小作用量原理与物理之美3——牛顿力学
就像最小作用量原理可以推导出所有几何光学定律一样,力学中也存在一个最小作用量原理的特例可以推导出整个牛顿力学。今天我们就来研究研究这个。
有这样一个事实:假定有一个质点在引力场中通过自由运动从某处移动至另一处——你把它抛出去,他就会上升又落下。如果画出x-t图(为了简化,只考虑一维的运动,设x轴是竖直的轴),那么运动图像是一条抛物线。你可以尝试着通过起点和终点画一些别的曲线,如果计算出经历整条路径期间动能减重力势能对时间的积分,你会发现所获得的数值比实际运动所获得的要大。如果我们设作用量S为
那么上面的事实换句话说就是作用量S在实际运动中取得最小值。对上面字母的解释:t1、t2表示运动的起点和终点时刻,1/2*m*v^2是研究物体的动能,V(x)是其势能(这里把它写成是随x变化的函数)。当物体只受重力的时候,V(x)=mgx。我们在上一篇文章中说过,一个泛函取得极值可以令其变分等于0,所以在力学中,最小作用量原理的特例就写作:…
最小作用量原理与物理之美2——费马原理
对于几何光学中的许许多多的定律,费马找到了一种统一的描述,现在被称为费马原理,被认为是最小作用量原理在几何光学中的特例,是最小作用量原理最早的成功例子。上一篇文章并没有真正写最小作用量原理,写的仅仅是一些简单的极值问题(千万不要认为那就是最小作用量原理),而本文与下一篇文章则将写最小作用量原理在几何光学与动力学的特例,并给出比较精确的数学公式(这是为了后面的横向比较和更深刻地理解最小作用量原理),对微积分头痛的人可以跳过公式只看文字。
费马原理是这么说的:过空间中两定点的光,实际路径总是光程最短、最长或恒定值的路径。
其中光程定义为该介质的折射率乘以路程。写成数学的形式就是:
其中,δ是变分符号,p1、p2表示空间中两个固定点,n为介质的折射率,s表示路程。为了理解上式的含义,我们需要和导数做一个类比。我们对一个函数求导数,如果导数值等于零,那么可以判断出原函数在该点处会取得极小值、极大值或恒定值。上面的式子和导数有一个显著的不同,导数研究的是以字母为自变量的函数的极值,而上式想求的则是以一个函数(位置随时间变化的函数)为自变量的泛函的极值。我们把每一条路径看作是位置随时间变化的函数,把这个函数看作自变量,我们要求的则是各条路径中光程取极值的那条路径;就像我们求导求的是各个x中使得y取极值的那个点。函数求极值可以用导数,泛函求极值则可以用变分法,即δS=0(其中S是一个泛函)。大家就把δ理解成和导数相类似的东西就可以了。…
最小作用量原理与物理之美1——自然中无处不在的极值
观察自然界的各种现象,会发现极值往往出现。知道这一点非常重要,在最小作用量被明确提出之前,人们已经研究了很多极值问题。我们先来看一些比较简单的极值问题,会对最小作用量原理有一个更深刻的认识,也能从中看出最小作用量原理的起源与历史。
物理定律都有两种表述形式:一种是普通的我们高中学的形式,用力、加速度、电场强度等概念描述的物理定律;另一种是极值的形式,在一个物理过程中某个量取得极值。这两种表述形式是等价的。
先看一个最简单的例子,如图,两个电阻R1、R2并联,输入的电流为I,求I1、I2是多少。
这个问题初中生都会做,用并联时电压相等加上欧姆定律就可以作了。可以容易的求得
现在我们换一种方法:I1、I2的取值使得热功率最小。…