谨以此文纪念哈尔莫斯
(Halmos,1916-2006)
诞辰100周年
作者| 林开亮
定价:¥49.00
人民邮电出版
社
,2016年
点击封面图立即购买↑↑↑
作者
谢尔登•阿克斯勒
(Sheldon Axler)
和他的猫,取自其个人主页http://www.axler.net/
在中国,线性代数一般等同于矩阵论,这主要是受
华罗庚
先生的影响,他的矩阵功底炉火纯青,因此他的学生
曾肯成
教授这样说:“龙生龙,凤生凤,华罗庚的学生会打洞。”所谓“打洞”,就是用相似变换或其它矩阵变换将矩阵化成标准型
(其中有很多元素为0,即“洞”)
。据华罗庚的另一得意弟子
陆启铿
院士讲,当初邀请华罗庚访问美国普林斯顿高等研究所的
外尔
(H. Weyl)
曾这样评价:“华罗庚玩矩阵就像玩数字一样得心应手。”大概是陆启铿先生的话被人听岔了,做出这一评价的外尔教授,有时被讹传为
韦伊
(A. Weil)
。稍微了解韦伊的人都知道,他不可能说这话。为什么呢?因为韦伊是法国布尔巴基学派的灵魂人物,他跟
谢瓦莱
(C. Chevalley)
都致力于消除代数中的行列式、结式等计算性的概念,而华罗庚是以矩阵计算见长,绝非韦伊所欣赏的风格。这里有
罗塔
(Gian-Carlo Rota)教授在1988年提供的证词(见其文章
Fine Hall in its golden age: Remembrances of Princeton in the early fifties
,收入A Century of Mathematics in America, Part III, History of Mathematics, Volume 3, P. Duren, Ed., pp.223-236, American Mathematical Society, 1989. http://www34.homepage.villanova.edu/robert.jantzen/princeton_math/pmcxrota.htm):
“
即便是本科生的线性代数教学,也留下了阿廷
(E. Artin)
清晰可见的印记:他在我们面前从来绝口不提基和行列式
(考虑到他是那么喜欢计算,这真是奇怪的禁令)
。阿廷的盟友,谢瓦莱和韦伊,竭尽全力将行列式和结式驱逐出代数。每每想到革命尚未成功,九泉之下的两位
(注:指1962年过世的阿廷和1984年过世的谢瓦莱,韦伊也在1998年过世)
可能都无心睡眠。
”
在这方面,韦伊和谢瓦莱的先驱,正是罗塔这里所提到的阿廷。荷兰数学家
范德瓦尔登
(van der Waerden)
曾根据
阿廷
和
诺特
(E. Noether)
的讲义,写成抽象代数的经典名著《近世代数》
(后来更名为《代数学》,有中译本,科学出版社)
,此书直接刺激了布尔巴基学派的诞生。
希尔伯特
(Hilbert)
、
诺特
、
阿廷
是近世代数的先驱,近世代数的思想一度在德国盛行。特别地,受到量子力学的刺激,
冯•诺依曼
(von Neumann)
将这一思想应用到无限维空间的泛函分析中,导致了线性代数的几何化。这方面的第一本书,就是冯•诺依曼在普林斯顿高等研究院的助手
哈尔莫斯
(P.R. Halmos)
根据他的讲义写成的《有限维向量空间》
(Finite-Dimensional Vector Spaces)
。该书1942年出版,之后多次再版,现已成为经典
(期待有朝一日能够引进中译本,这是笔者心目中独一无二的线代数圣经)
。
眼下这本《线性代数应该这样学》
(Linear Algebra Done Right 第三版)
,可以说,基本上是按照《有限维向量空间》的精神写的一本新书。这毫不奇怪,作者是圣弗朗西斯科州立大学数学系的教授
阿克斯勒
(Sheldon Axler)
。他是哈尔莫斯的徒孙,中间的链接是
萨拉森
(Donald Sarason)
。阿克斯勒写作这本书,可以追溯到他在1995年发表在《美国数学月刊》上的一篇阐述性文章《打倒行列式!》
(Down with determinants!)
,该文次年获得了美国数学协会颁发的 Lester R. Ford 写作奖。标题取名为“打倒行列式! ”,也许在中国的读者看来,有点不可思议!因为在通行的线性代数教科书中,行列式通常放在一开头讲的,如果直接扔掉了,后面还怎么讲?事实上,这是完全可以做到的,《线性代数应该这样学》就做到了这一点。在全书中,迹和行列式是最后一章,而之前讲完了线性代数所有其它内容
(尤其是作为矩阵灵魂的特征值与特征向量)
,根本不需用到这两个概念!
阿克斯勒之所以要打倒行列式,可能主要是想突出线性代数的本质方面是概念而非计算。正是出于对后一个看法的支持,促使我在这里向读者推荐这本书。
如前所说,线性代数的教学分两派:一派注重代数计算,以华罗庚先生为代表,这条线最终可溯源到美国的代数与数论学家
迪克森
(L. E. Dickson),中间的链接是
杨武之
教授
(
杨振宁
的父亲,把近世代数和数论引进到中国)
;一派注重几何直观,以哈尔莫斯为代表,最终追溯到诺特和阿廷,中间的链接是冯•诺依曼。虽然我本人经受的课堂训练是偏计算的(教材用北大的经典《高等代数》,它以
丁石孙
先生的《高等代数简明教程》为蓝本,丁先生在自传中说他借鉴了苏联
斯米尔诺夫
的《高等数学教程》;课堂之外,我的高等代数老师、天津大学数学系
田代军
教授指引我去读
华罗庚、万哲先
的《典型群》以及
雅各布森
(N. Jacobson)
的抽象代数著作),然而只是在我后来用哈尔莫斯的《有限维向量空间》重新学了一遍线性代数以后,我才敢说我对线性代数有了一点底气。我希望我说这话时,你不要认为我是在吹牛,我甚至希望这话能得到专业人士的认可,因为我在博士论文中的部分工作,就是用阿廷、冯•诺依曼、哈尔莫斯那一派的几何观念和方法,完善了华罗庚先生1947年的一项纯代数的矩阵工作。因此可以说,我是华罗庚先生和哈尔莫斯教授两派结合的产物。
代数计算将线性代数机械化了
(我有一次在打乒乓球时感觉每一次回球就像在做一次初等变换)
,同时也变得有点无聊。我常常有一种天真的想法,也许可以考虑用吴文俊先生倡导的数学机械化,将华罗庚学派炉火纯青的打洞技术给实现了!
要想让线性代数生动起来,除了介绍一些精彩应用的例子外, 一个可行的办法是强调几何的语言。几何的语言, 自然是相对于代数的语言而说的。简单讲, 就是用线性变换代替矩阵, 用抽象向量代替列向量。几何语言的优点是简洁明快, 例如“作用
(action)
”这个词给人的感觉就是如此。代数语言的好处是具体清晰, 两个矩阵“相乘”在我们头脑中的图象,是一系列具体运算的运作。通常的教科书往往过分强调了代数的语言, 这同时也充分暴露了其诸多弊端。最大的缺点在于容易将几何淹没于代数。而且,在很多问题中坐标的选取并不重要,我们所需要的往往只是一些基本的运算规律, 例如分配律、结合律等。这时抽象的几何语言就十分适用了, 例如在内积空间的理论中, 我们往往采用几何语言。其实,数学家正是靠这种几何观点来指引具体的代数运算的, 例如所谓
Gram-Schmidt正交化
, 无非就是将第二个向量沿第一个向量作垂线
(从三角形的一个顶点往底边引高线)
, 一旦指出这一点, Gram-Schmidt正交化的公式就很容易理解了。更近一步,理解
Cauchy-Schwarz不等式
就是水到渠成的了:它所对应的,无非是这样一个熟知的几何事实:直角三角形的直角边长不超过斜边长。
我要指出,我这里并非说代数计算不好,我想强调的是,要尽可能在在几何直观的指引下做代数计算。我觉得借用阿廷在其名著《几何化的代数》
(Geometric Algebra,1957年出版)
一书中的一句话来评论阿克斯勒的《线性代数应该这样学》再好不过了:
“
我的经验是,一个用矩阵进行的证明,如果你抛开矩阵的话往往可以使这个证明缩短一半。有时,这一点是办不到的,你需要计算一个行列式。
”
我将阿克斯勒的这本书郑重推荐给所有想重新从几何的观点看待线性代数的朋友,所有想从零开始学习线性代数的朋友。该书继承和发扬了哈尔莫斯《有限维向量空间》的几何化特色,以几何引代数,以概念指导计算!它会告诉你,线性代数不仅仅是矩阵论,或者更恰当地说,从几何的观点看,线性代数和矩阵论原来可以很简单!你不再需要
-矩阵,不再需要分块矩阵,更不必担心复杂的行列式计算会挡住你前行的道路!而且,额外的好处是,一旦熟悉了这种几何的观念和思维,当你应用线性代数和学习泛函分析时会更加得心应手。
根据我的经验,要使线性代数在你心中扎根,你需要读哈尔莫斯的Finite-Dimensional Vector Spaces。如果你还不习惯读外文教材,那么阿克斯勒的《线性代数应该这样学》中译本在目前是首选。
下面我们简单介绍一下本书的内容。全书共十章,其中三章讲向量空间(1,2,6), 一章讲多项式(4),六章讲线性映射(其余)。第一章讲向量空间,从经典的
维实列向量空间与
维复列向量空间出发,引出线性空间的一般概念。向量空间是线性代数演出的舞台。(记得我博士毕业找工作时面试高校教师时抽到的一刻钟试讲题目,就是向量空间。)第二章讲有限维向量空间,维数是向量空间的基本不变量,借助基与坐标映射可以给出抽象向量空间到列空间的同构。限制于有限维的好处是,所有的运算都是有限的代数运算
(不会涉及无穷)
。现在舞台搭好,主角要出场了,第三章给出线性映射的基本概念。线性映射是向量空间之间的自然映射,在基底下体现为矩阵。给定一个线性映射,就诱导出两个重要的子空间,核空间与像空间。线性映射的基本定理(3.22节)给出了这两个子空间的维数关系。(这样一个定量关系,其实可以用线性方程组的基本定理来描述。)这个基本定理只是对线性映射给出了最粗略的描述,为了更精细地观察线性映射,我们需要将它分解为简单的线性映射。为此,一个有效的工具是多项式,这是第四章的主题。这个概念其实不属于线性代数,但它的理论可以服务于线性变换,此即第五章的内容。主要的原因在于,当一个线性变换
作用于有限维向量空间
时,一定存在多项式
,使得
。这样的零化多项式
可用于研究
。例如,
的分解就对应给出
的不变子空间分解。在最理想的情况,若
分解为不同的一次因子的乘积,则
就分解为特征子空间的直和。(特征值与特征向量是观察线性变换的最佳视角,不过并非所有的线性变换都可以完全通过特征向量刻画)。第六章讨论内积空间。内积空间中因为赋予了可以度量长度、角度等几何观念的内积,从而拓展了中学阶段所熟悉的平面向量和空间向量的几何知识,例如勾股定理、正交投影等。但这不只是简单地重新唤醒我们的记忆,让我们将向量几何从二维三维推广到高维;现在有了前面关于向量空间与线性映射的概念,自然我们就要问,内积空间的不变量如何刻画?这就自然引出正交变换的概念,最终我们发现,原来正交变换
(以及平移变换——注意它一般不是线性变换)
就是我们中学所学习的全等
(也称为欧几里得运动)
概念的实质。
(在中学时,我从未了解到,平面上两个图形全等的真正含义是,存在平面上的一个全等变换可以将其中一个图形一一映射成另一个图形。)