2024年诺贝尔物理学奖被授予John Hopfield和Geoffrey
Hinton。相比于大红大紫的Hinton,Hopfield的知名度较低。有些具有神经网络知识的人即使知道Hopfield网络,也会觉得难以理解为什么他们会获得诺贝尔物理学奖。以下为John
Hopfield于2018年10月撰写的简短自传,讲述了他从凝聚态物理学到生物物理、神经生物学,以及最终在物理学、神经科学、计算机科学交叉领域发明Hopfield网络的研究经历。从中我们可以窥得Hopfield本人以及他发明的神经网络极深的物理渊源,更加难能可贵地,我们得以了解、学习一个伟大科学家的研究哲学,它被浓缩为一个简单的问题:现在该做什么?(Now What?)
Now What?
John Hopfield
我人生中的第一份全职工作是在新泽西州的贝尔实验室,一个六人理论物理小组聘请我担任技术人员,那时距晶体管在这里诞生已有十年。在我将康奈尔大学的物理博士学位论文以及其它事务完成后,于1958年3月初来到这里报道上班。我工作的第一个半天都在处理行政事务,并与几位理论科学家在自助餐厅共进了午餐。随后,我前往了新办公室,花一个小时翻阅了几本书,又去了五楼的储藏室,找到一些横线便笺本、铅笔和一把手持铅笔刀,削了几支铅笔。现在该做什么?
在我整个科研和教学生涯中,这个令人烦恼的问题也曾多次困扰我。每一位科学家、学者乃至作家、艺术家……也都忧虑着每天该去做点什么。大多数人的答案是:努力拓展一点昨天的思路、更新一下测试的标准或是推动一下事务的进展……而一旦被迫在更根本的层面上回答“现在该做什么”这个问题,或者要考虑长期地投入某项事业时,大多数人会尽力不去改变他们一直所坚持且擅长的方向。我获得2019年富兰克林物理学奖时的颁奖词写道:
因利用理论物理学的概念为遗传学和神经科学等多个领域的重要生物学问题提供了新的理解,并极大地推动了计算机科学中机器学习领域的发展而获奖。之所以能获得这样的评价,是因为我经常通过很大程度地改变自己的研究方向来回答“现在该做什么”这个问题。对富兰克林奖本身更多的解释表明,我获得奖项提名的关键在于两篇论文,下面我将描述我是如何偶然发现这两篇论文中所解决问题的。我对于“现在该做什么”这个问题的回答是:“或许存在一些不寻常的、可能很重要的、新颖的研究问题,因为我有物理学的背景,所以我可以提出并解决这些问题”。相比之下,那些背景似乎比我更相关的人反而不会轻易将这些情况视为问题并进行研究。如何选择研究问题是决定一个人在科研上取得多大成就的主导因素,我通常在科学问题上保持较短的注意力(请注意专业科学家和业余爱好者之间的界限,我经常越界)。因此,我一直在寻找更有趣的问题,要么是因为我目前的问题已经解决,要么是因为我的特殊思路将它们归类为难以解决的问题。什么是物理学?
对我而言,出生在一个父母均为物理学家的家庭之中,物理学从来不是一门被严格定义的学科。原子、对流层、原子核、一块玻璃、洗衣机、我的自行车、留声机、磁铁等等,这些可以随口说出的事物都属于物理。物理学的核心思想是世界能够被人们所理解,我们能够剖析任何事物并了解其成分之间的关系,还可以在此基础上通过实验对观察到的现象进行定量分析。因此物理学是一种观点,即通过我们的努力、独创性的思想和足够的资源,我们周围的世界是可以通过可预测和定量的方式来分析理解的,成为一名物理学家就是致力于追求这种理解。广义上的教育
我从小就喜欢拆解东西并观察它们是如何工作的,例如修理自行车,在厨房或者躲在地下室里探索化学反应,制作可飞行的模型飞机和简单的收音机,玩电池和线圈等等。我最早的记忆之一是一把放在我母亲使用的脚踏缝纫机抽屉里的小螺丝刀,它本是用来对缝纫机进行细微调整的,但我被允许用它来拆解家里的任何东西(只要我能把它放回抽屉里)。偶尔我会无法重新组装它们,父亲便会在晚上耐心地帮助我。我对于成为一名物理学家的早期概念颇具神秘色彩,我认为它将是在更抽象的层面上进行这种有趣的探索。在我父亲那一代,从事物理学注定不是高薪的工作。1929年,我父亲在Guggenheim奖学金的资助下前往柏林,并计划于1930年返回美国从事科研工作。由于当年华尔街股市崩盘导致大学停课,他接了一系列的临时工作,包括在1933年的芝加哥世界博览会上进行展览,我也正是在那时出生的。父亲最终在Libby Owens Ford公司找到了一份工作,对钢化玻璃和隔热板进行研究,这属于材料科学的领域。尽管我明白成为一名物理学家后的经济情况,但我也仅仅短暂地考虑过其它职业。由于我的高中化学老师非常优秀,而物理老师甚至对力学和电学的基本知识都缺乏了解,我在大学志愿专业申请表上填写了“物理或化学”。进入斯沃斯莫尔学院后,William Elmore成为了我的导师,他认识我的父亲并了解我的背景。我仍记得第一次走进他的办公室时,他拿起写着我的研究兴趣和正在考虑的研究领域的卡片,拿出一支笔划掉了化学并补充道:“我认为我们不需要考虑化学”。随着学业的深入,所有学生都必须选择某个特定的研究领域,此时我开始考虑攻读物理学的研究生,并寻找自己可能专攻的课题。我的成长经历使我特别关注身边世界的物理学,这并不是原子核或宇宙物理,而是日常生活及技术应用的物理学。我最终选择了康奈尔大学而非普林斯顿大学,因为在1954年,康奈尔大学似乎有一部分研究人员在关注固体物理学,它包括几门标题中带有固体的课程、一个固体物理学研讨会、两位从事该领域理论研究的教授和四个相关的实验项目。主要研究的实验问题包括低温热导率、碱金属卤化物的色心、绝缘体的紫外光谱和X射线吸收特性等。该部门的其他研究方向包括核物理、粒子物理、X射线以及宇宙学/天体物理学等等。在康奈尔大学就读二年级时,我找到了理论物理学家Albert W. Overhauser,并咨询他是否愿意指导我的论文并帮助我修改其中的问题。在他的指导下,我迅速掌握了理论物理学领域的工具,但我仍不知道如何找到合适的研究问题。因为寻找一个好的问题在过去(甚至是现在)不是会在课堂或研讨会上讨论的主题。幸运的是,Albert总有许多有趣的问题,这些问题通常以悖论的形式出现,例如“对固体物理学中某一特定现象的基本理论分析得出结果A,但实验得出完全不同的结果B”,他被引用次数最多的论文的开头两句话是:
离子晶体的介电常数和压缩率的简单经典理论得出了两个实验量之间的关系,其中参数的任意性已被消除,这也被称为Szigeti关系。但实验数据完全无法满足这两个关系,从而表明这些简单理论的纰漏之处。(B. G. Dick and A. W. Overhauser, 1957)这篇论文总结了他第二个学生Gayle Dick的博士论文,描述了一种更好的物理模型,能够消除理论和实验结果之间的差异。对于他所列出的大多数悖论问题,其实他本人也不知道是什么导致了常识性理论方法与现实实验数据之间的冲突。我选择了一个与晶体中激子的辐射寿命有关的悖论,其中的冲突出现在理论本身。Albert根本没有研究过它,当我去见他时,他作为倾听者和批评者给予了我极大的支持,但找到方向并解决技术理论问题则完全是我的工作。他给我最宝贵的指导是要拥有一个有趣的问题,并对研究和进展负全部责任。谢谢你,Albert,我已尽我所能,通过同样的方式培养新一代独立研究的学生来回报你。第一份真正的工作
手握理论固体物理学的博士学位论文,我进入了就业市场。选择学术界还是工业界?在我参观了AT&T的贝尔实验室和通用电气后,答案变得显而易见了。我看到了该领域在工业界的蓬勃发展以及这两个实验室相对不受约束的研究氛围,他们在固体物理学方面的研究项目比任何大学都更广泛、更有活力。我最终选择了贝尔实验室,主要是因为它的实验室管理机构在当时经过了重新调整,从而有一个小型的理论物理小组,而不会将我直接分配到电磁学或半导体等子领域。相比之下,通用电气在其每个固体物理专题小组中都有几位理论学家。当然在那个时代,加入贝尔实验室的固体理论研究有点像加入洋基棒球队当投手。这些理论学家们都在研究与Overhauser所研究相类似的问题。例如P. W. Anderson 刚刚发表了他的论文“某些随机晶格中不存在扩散”,其动机是试图解释Feher在硅掺杂实验中电子自旋弛豫的矛盾的实验结果,这篇论文后来成为了他获得诺贝尔奖的基础;Melvin Lax试图以不违反热力学第二定律的方式阐述半导体二极管中的噪声问题;Conyers Herring提出了“声子拖拽”来解释掺杂半导体中异常巨大的热电能;Gregory Wannier 正在研究“斯塔克阶梯”及其在高电场中可能观察到的情况。现在回想这一段经历,让我印象最深刻的是,所有人研究的主题都是固体物理学的一般性问题,且理论研究通常基于详细的实验,而并非由AT&T的材料科学和设备需求所驱动。贝尔实验室的大部分工作当然是针对后一类问题,但我所在的理论小组却截然不同。Conyers是理论小组的负责人,当他看到我苦苦寻找接下来的研究课题时,他建议我拜访实验者们去进行有趣的探讨。我仍然记得许多次这样的拜访经历。Schawlow向我解释了1958年Townes-Schawlow关于“光学脉冲”可能性的理论论文,然后他从办公桌抽屉里拿出一根长约三英寸的粉色棒,描述了Cr3+杂质光谱的奇妙特性,也正是这种杂质将氧化铝变成了红宝石,但他在讲解结束时指出,R1和R2谱线完全不适合制造光学脉冲。然而两年后,在Maiman展示了闪光灯泵浦红宝石中的激光作用后,该晶体被贝尔实验室用于制造了第一台激光器,但Schawlow当时还没有想到制造脉冲激光器的重要性。Bill (Willard) Boyle正在测量半金属铋的低温磁热性质;George Feher用他最近开发的ENDOR技术绘制出了硅中磷供体的电子波函数;Bernd Matthias告诉所有听众,超导性实际上不可能是BCS型的,因为某些材料中没有同位素效应;Robert J. Collins向我介绍了硫化镉中的“边缘发射”发光特性,这为我的第二篇论文提供了课题。在参观完Jim Lander的专门研究氧化锌的分支部门后,我结识了David G. Thomas,我们随后的合作为我提供了未来几年所需的研究课题。贝尔实验室黄金时代的神秘感,以及管理人员和科学家们的远见卓识也吸引我来讲述这个团队背后的故事。在1960年之前,真空管是所有电话电子设备的基本放大器,真空管需要从热阴极发射电子,但为了延长使用寿命和降低功耗,温度需要尽可能低,而有氧化钡涂层的阴极在这方面效果很好,因此贝尔实验室还成立了一个研究氧化钡的小组。到了20世纪50年代中期,真空管的时代显然结束,尽管如此,第一条跨大西洋电话电缆(1956年)每隔43英里就配有真空管放大器。(虽然这条电缆在使用22年后因技术过时而停用,但所有真空管仍在正常工作!)由于氧化钡不再是AT&T未来技术所关注的材料,并且该团队在氧化物材料方面拥有经验,因此它将研究重点转向氧化锌。众所周知,氧化锌是一种半导体,因此可能与电子技术有关,而且氧化锌晶体相对容易生长。因此,Lander团队能够通过设计一个略显合理的替代理由来维系自身并在贝尔实验室架构内不断发展。
我对“接下来做什么”的十年回答
在这样的背景下,我结识了化学家David Thomas,我们分别负责理论与实验工作,共同研究了许多种类的化合物半导体。在研究中,我发现了多年未曾预料的问题和悖论,为AT&T提供了化合物半导体和半导体光学的主要知识基础。这项工作为我和David赢得了美国物理学会1969年颁发的“Oliver E. Buckley Solid State Physics Prize”。但在当时,没有人会想到光与化合物半导体的结合在今天会有如此光明的前景。离开我的“老本行”
1968年,我在凝聚态物理学方面遇到了瓶颈,我的天赋似乎不再发挥作用。我获得了Guggenheim奖学金并前往剑桥大学的卡文迪许实验室待了半年,希望能找到新的有趣方向,但并未能如愿。于是我回到普林斯顿大学,在贝尔实验室的半导体小组担任顾问时,我遇到了正在进行高分辨核磁共振研究的化学家Robert G. Shulman。当时,研究工作者使用各种各样的物理技术来研究血红蛋白分子,例如核磁共振、电子顺磁共振、光谱、共振拉曼散射、X射线结构研究、中子散射、穆斯堡尔光谱等等,所有巧妙的固体物理学实验技术似乎都与血红蛋白有关。在一段时间内,血红蛋白成为物理学家理解蛋白质功能的“氢原子”。Shulman希望有伙伴能帮助他从理论上解释的NMR结果,他希望能从中理解生理学中重要的协同氧结合现象的物理基础。他了解我与贝尔实验室的化学家David Thomas交流后所取得的成绩,所以他努力让我对血红蛋白问题产生兴趣,并希望这类研究能推动生物学成为一门“硬”科学。充分了解我的能力后,生物学是一个非常适合我的领域
在20世纪70年代中期,我为一部关于化学、物理和生物学交叉研究的教育影片做了旁白。影片中有一个简短的片段,讲述了化学家Linus Pauling对一个关于他如何选择研究课题的问题回答。在这个片段中,Pauling提到:“我会问自己,我所考虑的问题是否是我有可能做出贡献的问题”。可见即使是Pauling,这位本可因首次理解遗传分子疾病而获得生理学和医学诺贝尔奖的人(尽管他已经是化学与和平领域的双诺奖得主),也认为研究问题与个人才能的匹配是重要的,仅仅知道问题很重要并不足以成为继续研究它的充分理由。血红蛋白为我从凝聚态物理领域转到生物物理领域提供了一个切入点。正如在许多固体物理中所表现的,结构和低能激发如何影响实验物理性质是问题的关键。生物学为科学带来了一个独特的“功能”概念,这是生物学所特有的,出现在生物学和应用科学/工程中,这些领域的目的是为了造福人类,但与纯物理、纯化学、天文学或地质学无关。我与Shulman小组合作了几年,研究影响血红蛋白平衡氧结合协作性相互作用的能量描述,贝尔实验室对此项目给予了一定的支持。我从一个半导体小组的理论指导变为了一个生物物理小组的指导,用一句玩笑话说,由于我从一个我极为精通的领域转到了一个我一无所知的领域,在那年实验室几乎无法提高给我的顾问费。从客观的角度说,我们取得了一些成绩,使用同一个框架来解释各种不同的实验结果。我们小组中有一位不知名的成员Seiji Ogawa,20年后他利用其NMR和血红蛋白的专业知识而发明了功能性磁共振成像(fMRI)并因此成名。Shulman小组随后将研究重点从血红蛋白转向了被称为tRNA的核酸,通过NMR他们可以确定分子的二级结构。然而由于缺乏将这些实验与功能性问题联系起来的方法,我对小组关于tRNA的实验失去了兴趣。不过我还是参加了许多外来学者的研讨会,他们描述了tRNA的功能生物学,而对其结构知之甚少。45年后仍然令我记忆犹新的是Herbert
Weissbach关于蛋白质合成的讲座,这个讲座充满了细节,任何物理学家都很难记住。但其中包括一部滑稽的情景剧,他让学生们扮演氨基酸、tRNA和蛋白质等,最后一群连接成链的“氨基酸学生”被合成,而“磷酸和tRNA学生”则消失无踪。我对此的总体印象是,在蛋白质合成过程中似乎存在着极为奢侈的高能分子浪费,演讲者专注于描述合成蛋白质的线性生化过程,却并未提到我作为物理学家对浪费的看法。我被迫参加这个两小时的讲座,但让我清楚地认识了生物化学家是如何看待一个复杂问题的。与此同时,我在普林斯顿大学开设了我的第一门生物物理课程,主要面向物理学的研究生。不幸的是,我在血红蛋白上花费了不合理的时间,这是生物学问题的一个糟糕的入门,因为其最明显的物理问题是平衡问题,而生物学的本质在于一个常常远离平衡状态的动态系统。在学期开始五周后的一天晚上,我沉下心来,决心探索一种适用于任何生物动力学问题的理论处理方案。唯一的前提是,这种处理要在只需了解基础量子力学和基础固体物理的水平和方式上进行。很快我意识到,从物理的角度来看,生物学中最简单的化学反应是电子转移,伴随很少的核运动且没有化学键的重排,例如光合作用的早期阶段和一些氧化磷酸化的重要过程就是这种性质。于是,那天晚上我确定了下周的研究课题,并粗略解决了电子转移速率的问题。由于需要休息一下,我在电子转移讲座后安排了三周的标准生物物理讲座,内容包括细胞膜和描述神经冲动沿细胞轴突传播的Hodgkin-Huxley方程。虽然我的讲座没有任何原创性或创造力,但准备这些讲座的过程奠定了我在神经生物学领域的基础,因此是无价的。在课程的最后一周,我努力描述了一个涉及tRNA的动力学问题,选择这一类分子主要是因为除血红蛋白外,tRNA是我唯一了解的生物分子系统,tRNA在按照mRNA指令将氨基酸合成蛋白质的过程中扮演了核心角色。只需短暂的物理思考就能得出结论:这种过程的准确进行在一定程度上是一个化学动力学问题。尽管我对生物化学的了解有限,但在最后一周的讲座中,我转向了准确合成蛋白质的动力学问题。大多数关于蛋白质合成的生物化学研究和教科书都基于化学反应的锁钥模型描述,即错误的反应不可能发生,因为“错误的氨基酸不能匹配”。理解生物化学通常是解释“发生了什么”的问题,而对“未发生的事”却思考不多。但是,从物理学的角度来看,大多数生化反应在室温下都是可能的。相似但不同的反应仅会有不同的能量区别,因此不同的玻尔兹曼因子决定了动力学速率。实际上,它们可以基于能量差异进行区分,生物化学家对“发生A而不发生B”的说法应该被替换为“A以exp(-EA/KT)的速率发生,B以exp(-EB/KT)的速率发生”。错误反应的速率与正确反应的速率之比是exp(-(EB – EA)/KT),其中EB – EA是一个正值的能量差。我设法组织了几场讲座,表明为了准确的生物合成,化学反应网络不应被推动得太快,但这些讲座并没有涉及原创构思,只能作为课堂学习材料而非研究。而在准备讲座的过程中,我做了一个粗略估算,两个非常相似的氨基酸——缬氨酸和异亮氨酸之间的能量差,这两种氨基酸仅在一个甲基基团上有所不同。我计算出任何“合理的”异亮氨酸结合位点对错误使用较小分子缬氨酸的最大区分能力约为1/50。不幸的是,当时已知的生物蛋白质合成过程的实验数据(来自物理学家R.
B. Loftfield于1963年的出色研究)约为1/3000。看来我在不同领域中应用估算技术的能力还不够!为了提醒我这个物理学家不要自大,我向班级描述了我显然不充分的估算。
一个潜在的问题——校对(proofreading)在学期结束后,这个问题仍然困扰着我。一个月后,我意识到这可能是一个有趣的悖论。我的估算大致正确,但Loftfield也可能是对的,而准确度的水平可能不是由简单的能量差决定。在宏观层面上,打字员可以对文档进行校对,从而生成一份最终稿,校对过程改正了大部分原始打字错误。因此一种解释这个准确性悖论的方法是,细胞生物学中包含了一种在分子水平上校对生化反应的方法。可能存在这样一个研究问题,即体内生物化学是否进行这样的校对,而我们(生物化学家)还没有注意到这一事实,因为我们没有意识到要去探寻。关于Overhauser效应的插曲
我非常感谢很多人,尤其是我的论文导师Albert W.
Overhauser,我通过发现一个悖论来寻找研究问题的方法直接来源于他。但认识Albert也让我深入思考他最伟大的研究论文“金属中核的极化”(A. W. Overhauser, 1953)的意义,这个主题是物理学所能达到的与生物学之间的最远距离。这是一篇极其出色的论文,我引用了1979年他在芝加哥大学获得荣誉科学博士学位时的颁奖词:
“Overhauser提出了极具原创性和令人震惊的想法,这些想法如此不同寻常,以至于最初让部分科学界感到出人意料,但它们的深度和重要性打开了科学的广阔新领域。”这一发现被称为Overhauser效应,它对核磁共振产生了巨大影响,并进一步影响了化学、生物学和高能物理等领域。这一想法最初遭到了该领域权威人士的强烈抵制,直到1953年Slichter和Carver通过实验证明了它的存在,它才被完全接受。Overhauser论文的推广对如何使用NMR来确定分子结构产生了广泛影响,这篇论文是他获得国家科学奖章的基础,此外,Kurt Wüthrich在2002年获得的诺贝尔化学奖,在很大程度上也基于Overhauser的理解。这里请允许我简单说一下,为什么几乎所有听说过Overhauser论文的人都会觉得它大错特错,他的理论预测违背了所有物理科学家的基本直觉。假设有人试图向你推销一个可以在微波炉中制作冰咖啡的杯子,这个普通的杯子有这样的特性:杯子的大部分会自然地被微波加热,但杯子里的咖啡却像变魔术一样变冷。这正是Overhauser在推广的观点,他声称,当一块金属暴露于强微波下时,样品的某些部分会变得更冷。即使你偶然发现了可以揭示这种奇思妙想可能性的论点,但认为每一小块锂金属本质上都表现得像一个微妙的冰箱的想法是荒谬的,不过这却恰恰是真实的。Overhauser再也没有写过关于这个领域的研究论文,这一见解并不是Overhauser被引用最多的论文,但这也说明了用论文被引用次数来衡量其对科学重要性是不合理的。当时我对此非常感兴趣,以至于我脱离了Overhauser论文中占主导地位的金属物理学细节,形成了另一种简单的自我理解。多年后,这种理解暗示,如果生化系统也涉及与化学能量来源的耦合,那么Overhauser效应的生化相关因素可能解释生物学如何达到高精确度。这个概括是如此隐喻,且与生物化学相去甚远,以至于我在1974年的论文中没有提到它,尽管这对我关于校对的思考极为重要。提高准确性的另一个方法是适当地等待,当一个化学复合物短暂形成时,它继续结合的概率呈指数衰减,且其寿命取决于结合能。结合位点与其优选氨基酸的瞬态复合物的寿命会比与错误氨基酸的长,如果像“麦克斯韦妖”一样观察一个未识别的氨基酸匹配到结合位点,但在使用该氨基酸之前等待很长时间,那么错误氨基酸仍然存在并被错误使用的概率将比正确氨基酸小得多,但这一点需要不可逆性,因此需要能量耗散。接近答案了
这两种观点都没有详细描述对于任何特定的生化系统如何实现校对过程,他们唯一明显的共同点是:从固定的能量差中获得更高校准准确度的概念都涉及将生化系统与能量来源相耦合。还记得Weissbach的研讨会吗?蛋白质合成过程中涉及大量无法解释的生化能量消耗,在获得这一见解后的一个月里,有些更为紧迫的事情消耗了我的时间,但现在我已经知道了足够多的细节并可以绝对肯定,当我能回到这个问题上时,蛋白质合成过程中如何校对的原理将是显而易见的。校对原理隐藏在生物化学的细节之中
在两个月的时间内,我根据已知的生化细节找到了蛋白质合成过程中校对的合理解释,并描述了可以作为评判校对是否发生的关键测试的实验类型。为了将氨基酸添加到正在合成的蛋白质中,需要使用含有一个 GTP 分子、一个tRNA 分子和一个氨基酸的特定复合物。当时人们的共识会将GTP的使用量和添加的氨基酸之间的生物化学计量比描述为1:1,任何偏离这个整数比率的测量值都应归因于实验测量中的偏差。但我预测这个化学计量比不是整数,也就是说即使添加正确的氨基酸,也应该存在一定的偏差,化学计量也会略大于1:1,而添加不正确的氨基酸时,该比率应该很大——肯定大于10:1,但我暂时不知道如何设计一个真正的实验来测试这个想法。校对的基本反应方案似乎同时存在于DNA合成、tRNA装载和蛋白质组装中。我在1974年的研究论文中,将这三个截然不同的化学反应过程统一整合为一个原理的不同表达形式。虽然在这篇论文之前,人们已经理解了DNA合成的某种“编辑”描述,但对于校对和鉴别的普适能量和动力学方面尚未有相关研究。然而,即使在这篇论文发表两年后,仍然没有多少分子生物学领域的读者。所幸有Bruce Alberts,也就是后来的美国国家科学院院长,对我的论文终稿提供了许多帮助。他指出生物化学家往往通过细节来观察过程,如果论文描述中有任何细节错误,他们就会拒绝这个想法或观点。因此他仔细纠正了我在化学命名方面的所有无知错误,这也成为了我第一篇包含“核苷”、“合成酶”、“异亮氨酸”甚至“GTP”等专业名词的论文。后来偶尔会有人邀请我去参加生物物理学领域的研讨会,1976 年,在哈佛医学院,我对蛋白质合成中非化学计量的预测问题进行了一个简短的演讲,演讲结束后的第二个问题来自Robert C Thompson,我完全不认识他。他只是问“你想听听这种实验的结果吗?”,然后便开始描述他当时尚未发表的实验和测量的化学计量比,这些比率数据完全支持了我的校对想法。他接着描述了链霉素能够杀死细菌是通过破坏校对过程,导致蛋白质中存在许多错误,从而使细菌无法存活。(R.C. Thompson and P.Stone, 1977)这是我科学生涯中最大的——也是最令人愉快的惊喜之一。1974 年的这篇论文对我研究生物学问题的想法很重要,因为它让我开始思考生物学中网络结构的功能,而不只是分子自身的结构功能。网络是可以“解决问题”的,或者具有超出单个分子和线性通路能力的功能,我在六年后思考神经元网络而不是单个神经元的特性时进一步拓展了这种观点。现在该做什么?发现问题!
1977年,我在哥本哈根的玻尔研究所度过了漫长的冬天,在这里对生物学领域进行少有但具有历史意义的推广活动。我的任务是邀请来自欧洲各地的杰出演讲者,举办一场题为“modern biology for
physicists”的系列研讨会。借助玻尔的名声,我成功招募了一批优秀的演讲者。因为在那个时代,所有人都知道玻尔对生物学的兴趣。1932年,年轻的理论物理学家Max Delbruck在度假后抵达哥本哈根,赶赴International Congress on Light Therapy的开幕式,玻尔在那里发表了题为“Light and Life”的演讲并提出了对生命本身的深刻解释,以及如何解释量子力学的哲学模糊性,是否本质上是交织在一起的问题。这次演讲对Delbruck来说是一次变革性的经历,这使他走上了从理论物理学到获得诺贝尔生理学和医学奖的道路。然而,在1977年的系列讲座中,那些杰出的生物学专家依然强调了他们所理解的内容,并回避那些概念框架和研究范式中的所有缺陷。他们显然没有认为生物科学需要理论物理学家的帮助(或欢迎他们参与)。我和其他所有人都没有获得任何变革性的体验。这让我有点失望,回到普林斯顿后,我依然没有发现任何新的问题。人们总是可以对先前论文的主题进行修改和扩展,无论是你自己的还是别人的。科学研究文献中绝大多数都是这样的工作。但我现在要做的是发现问题,而不是解决问题。两者的区别是什么?20 世纪70年代初,我担任一位想象力丰富但有点古怪的化学专业学生的博士生导师。在我指导完成一篇理论化学论文后,他成为James D. Watson实验室的博士后。大约九个月后,我见到了Jim。得知我以前的学生还没有安定下来做点什么,我表示了歉意。但Jim打断了我的话并表示没关系,“我第一次见到Francis Crick时,他35岁,此时还没有发现任何研究问题。”尽管其实Crick在那个年纪已经写了10篇可发表的论文,但是主要是关于X射线晶体学的,Jim认为Crick仅仅是在解决问题,而不是发现问题(指的是DNA双螺旋结构,编者注)。现在回想起来,我正在寻找生物学中的问题,而我不同寻常的背景为解决这一问题提供了独特且适当的准备。
神经科学/NRP
1977年秋天,正当我准备穿过普林斯顿大学的校园去讲授生物化学课程时,我的办公室电话响了起来,由于正在期待着网球伙伴的电话,于是便匆忙接通,却发现电话里是Francis O. Schmidt。他正在麻省理工学院负责神经科学的研究项目(NRP),并将于下周三在普林斯顿转机,他非常希望我能够拿出半小时见他。我从未听说过 Schmidt以及NRP,但是心想着“30分钟并不算什么”,于是同意了见面。一周后,他向我介绍了一个名为神经科学的研究小组,主要计划在波士顿举行小型会议,将有20名正式成员和20名来访者参加。来访者的选择范围很广,但会倾向于该次会议所讨论的研究领域。Schmidt邀请我在下次会议上发表演讲。我提议了一名上过我的生物化学课程的物理学研究生,他曾写过一篇关于神经编码的数学论文,因此我认为他将比我能够发表一场更能引起听众兴趣的演讲。但Schmidt很快就拒绝了这个提议,即便我告诉他自己对神经科学一无所知(这是Schmidt几年前创造的词),他说这没关系,“只说你感兴趣的就行”,于是我准备演讲关于动力学校对和大分子细胞生物合成的准确性问题。当时的听众包括许多神经学家、神经内分泌学家、心理学家、免疫学家、电生理学家、神经解剖学家、生物化学家等,他们几乎听不懂我讲的内容。但Schmidt认为这没有关系,他始终想寻找一名物理学家加入小组,或许可以帮助它变得更加综合,使神经科学成为一门更具综合性的学科。Schmidt坚信科学总有一天能够以某种方式弥合分子、大脑、思想和行为之间的鸿沟,他对这方面有着近乎狂热的信仰。在他的提议和领导下,小组投票通过让我成为成员。后来,我被会议上的演讲迷住了,在我看来,思想如何从大脑中产生是人类所提出的最深奥的问题。这个由众多才华横溢、充满热情的科学家组成的 NRP小组正在以狭小的领域来研究这个问题。在我看来,这群科学家永远不可能解决这个问题,因为解决方案只能用适当的数学语言和结构来表达。当时参与NRP的人中没有一个人能在这个领域轻松行动。所以我加入了这个小组,希望定义、构建或发现我可以在这个领域做的有用的事情。我的基础神经生物学知识正是来自参加每半年一次的NRP会议,坐在各自领域的世界级专家旁边,他们会耐心地向我解释他们对正在发生的事情的解释。尽管Schmidt尽了最大努力让专家们广泛地讲解他们的主题,并以综合的方式描述神经科学,但他通常是失败的。所以我的介绍包括一组不连贯的实验神经科学专家的观点,以及神经科学其他领域的专家的解释性评论。这些评论通常对其他子领域的研究细节不耐烦,但科学总是如此,无论如何我所寻求的不是细节。我给自己的任务是找到一种综合的观点,试图以某种方式超越讲座中关于灵长类神经解剖学、昆虫飞行行为、发育不全的电生理学、大鼠海马学习、阿尔茨海默病、钾通道、人类语言处理等的不连贯细节,而寻找一个可以使用理论物理工具进行的研究项目。大脑和机器通过遵循不断发展的状态轨迹进行“计算”
数字计算机的机器状态由程序和数据构建的隐式函数表达,基于机器的初始状态,计算机可以演变到问题的正确结果。在计算机的每一个时钟周期,机器状态可以根据芯片中内置的逻辑规则演变,演变停止时,意味着机器已经达到了其最终的状态,此时几个特定的寄存器中的数据即为问题的最终答案。元胞自动机是一类非常特殊的数字计算机,曾短暂地兴起于20世纪70年代末期。元胞自动机包含一系列地位等同的“元胞”,就像棋盘上的方格一样(忽略颜色)。其中每个“元胞”都具备一个内部状态变量,且该状态仅依据自身和相邻元胞的内部状态以确定的规则进行演变。其中所有元胞的地位都是等同的,且他们的内部状态也是同时演变的。我在阅读《科学美国人》杂志上的“生命游戏”文章时,第一次听说了元胞自动机的概念,我认为对这一基本概念的总结或修改可能有助于理解大脑的运作方式。我推测,如果元胞状态转换的规则不是严格结构化的,而更像连接神经元的突触神经网络,并且如果时间上的同步性条件被放宽来反映信号传播和处理中的神经延迟,那么就有可能弥合数字计算机和神经网络系统之间的概念鸿沟。1978 年秋天,我开始尝试对“生命游戏”进行一些修改,使其变得更像神经生物学,并期待看到它通过遵循状态演变轨迹来“计算”答案。不幸的是,我无法通过进行大量的数学运算来描述此类模型的状态变化轨迹,因此我需要编写一台数字计算系统来模拟该类模型,并进行相关计算实验以深入了解该类模型的各种性质。在数字计算机高度发展的今天,很难想象出37年前大学里原始状态的计算机和计算机实验室。当时的计算机运行速度慢、成本昂贵,且输入输出主要通过打孔卡和大型打印机实现,显示器终端在当时也极其少见。通常情况下,我们以微处理器中晶体管的数量来衡量计算机的性能,在过去50 年以来一直遵循“摩尔定律”,性能大致每两年翻一番。这意味着从 1978 年到现在,计算机的性能已经翻了18番。因此,当年我可以使用的计算性能只有当下计算机的1/250000(2的18次方分之一)。除了极少数的情况(例如麻省理工学院的人工智能实验室)之外,计算机在当年都被用来使用可靠的程序和昂贵的数据计算生成数值结果。如果你用计算机模拟了一个模型,那你应该充分地事先确信该模型与实际情况非常吻合,因为你没有可能对各种模型进行计算机实验——这太昂贵了,并且会浪费宝贵的计算资源。当时,并没有易于编程的计算机语言,计算效率高的语言通常难以编程使用。当时,普林斯顿通用计算和普林斯顿高能物理组的计算机(物理系唯一的计算机)以数字计算的模式运行。用计算机去猜测模型的结构,并且可以快速轻松地得到这些猜测的结果,寻找有趣的神经活动演化模型,这整个计算过程对于普林斯顿大学和贝尔实验室(我当时也在那里工作)的计算设备来说都是难以想象的。鉴于我能够支配的计算资源,我几乎没有取得任何进展。我想要追求的基本思想是,任何计算机,无论是数字机器还是大脑,其计算过程都要遵循从起点(程序和数据)到终点的动态演变过程,并且该过程要对噪声和干扰保持一定的鲁棒性,这样才能在存在噪声和系统缺陷的情况下得到可靠的答案。我确实就利用动态吸引子进行计算(神经生物学作为计算系统)的这一想法进行了 NRP 演讲,但当时既没有计算机模拟结果,也没有数学推理来证实这一观点。后来,一位土耳其青年访客找到我,告诉我这是一次精彩的演讲,但遗憾的是该计算系统与神经生物学无关。我应该说明,2015 年我从神经科学学会获得的 Swartz 奖(计算神经科学奖)实际上就是因为这个基本的想法。当然,计算神经科学这个术语的存在本身就意味着现在该领域有许多相关的科学家,而这在 1979 年是极其罕见的。更好的研究环境
1978 年,加州理工学院校长Harold Brown辞职,出任国防部长,加州理工学院需要一位新的物理学领域的校长。因此,他们找到了Marvin Goldberger,他是一位著名的理论物理学家,曾担任普林斯顿大学物理学系主任。Delbruck是加州理工学院生物系的教师,他和Goldberger一直在努力加强生物学和物理学之间的联系。Goldberger注意到我曾在普林斯顿大学物理系致力于研究生物物理学,因此,在他担任加州理工学院校长期间,他曾说服其他教职工为我提供化学和生物学联合教授职位。加州理工学院物理系则由Murray Gell-Mann和Richard Feynman主导,他们对任命该方向的教授毫无兴趣。普林斯顿物理系的立场是什么?我在物理系期间撰写了两篇最有趣的生物学相关论文(关于动力学校对和生物电子转移),但从未就此举办过物理座谈会或物理研讨会。普遍的看法是,我可能在做一些有趣的事情,但对于物理学来说,它涉及了太多细节。不过,物理学系主任 Val Fitch 还是私下设法任命我为特聘教授。1979年10月,我去见Val,告诉他我获得了加州理工学院的录取通知。他说,遗憾的是,我去加州理工学院对我们双方来说都是最好的选择。从科学研究的角度来说,这对我最有利,且他自己也能解决院系的相关问题,因此对于我的离职没有反对意见。1980年2月,加州理工学院的量子化学计算设施为模型试验提供一个绝佳的计算环境,它可以支持多用户的实时计算操作,具有 CRT 显示器和输入键盘,并且没有编译延迟。我的研究不符合这个设备的预期用途,但没有人注意到这件事情。但很快人们就发现,一年前大家对大脑计算与传统元胞自动机关系的猜测设想毫无用处。放弃一个已经酝酿了一年的错误想法是出奇的困难。因此,元胞自动机并没有被完全抛弃,而是被转化为一个随机的准神经网络。元胞自动机的规则结构被抛弃,取而代之的是随机选择的连接,状态转换的复杂逻辑规则被生物学启发的规则所取代。但经过一年的模拟和数学研究,我终于放弃了随机网络。相反,为什么不尝试一个具有特定结构的网络来完成一些简单但深刻的任务,这些任务神经生物学可以快速完成,而且对生物学来说这似乎是自然而然的,但对计算机来说却不是呢?概念上最简单的任务,也是自然地融入通过动态系统吸引子进行计算的基本计算范式的任务,是联想记忆。联想记忆是双向对等的——看到某人会让你想起他们的名字,而听到他们的名字则会想起他们的样貌(至少在我年轻的时候是可以做到的)。这一现象可以通过具有对等的联系的网络结构来实现,这种网络的数学表述与“自旋”系统的数学形式密切相关,后者负责描述固体中任何复杂形式的磁性。我通过与贝尔实验室的理论物理学家沟通,对这些系统有所了解。突然间,我理解了神经生物学和物理系统之间的联系(这要感谢我与P.W. Anderson的终身互动)。一个月后,我开始撰写一篇论文。发表论文
我之前曾同意参加 1981年夏天在凡尔赛举行的题为“从物理学到生物学”的研讨会。这是一次不同寻常的聚会,组织者是Maurice Marois,他是一名医生,梦想着加强不同领域科学家之间的联系。他善于说服赞助商,奉承诺贝尔奖获得者,并在凡尔赛宫的镜厅与会议演讲者举行了一场豪华而自命不凡的会议,演讲者住在城堡旁边的酒店。我很高兴地接受了这次免费巴黎之旅的邀请(虽然有点腐败)。我放弃了之前选定的主题,转而基于最近的工作发表演讲,使这次在凡尔赛的演讲成为该主题的第一次公开演讲。我为这项研究撰写的第一份手稿宽泛介绍了我最近的研究及其为计划中的会议论文集所设定的学术背景,但当组织者放弃这本书的项目时,我开始将我的草稿转换成一篇研究文章。我将物理学家和神经生物学家作为论文的目标受众,所以我立即想到在PNAS上发表文章。因为神经生物学家会阅读PNAS,从而可能会看到这篇文章,而尽管在那个时代很少有物理学家定期阅读PNAS,但至少PNAS通常可以在物理图书馆中找到,因此这是我能想到的最好的办法。作为科学院院士,我可以无需任何审查就发表这样的论文,然而为PNAS提炼我的论文是一项挑战,因为文章长度有5页的绝对限制,但要针对两个受众群体,我有很多话要说。关于非小说类作品的写作,海明威曾说道:
“如果散文作家对自己所写的内容有足够的了解,他可能会省略自己知道的东西,而如果作者写得足够真实,读者就会强烈地感受到这些事情,就像作者已经陈述过一样。”(E. Hemingway, 1932)PNAS的篇幅限制迫使我反复斟酌论文所写和不得不省略的内容,如果海明威是一名物理学家,他就会认出这种风格。现在看来,省略那些几乎显而易见的内容可能增加了这篇论文的影响力,这成为了其他研究者加入这个主题的邀请函,成功的科学总是一项公共事业。这篇论文于1982年发表在PNAS上,我第一次使用了“神经元”这个词。它为许多物理学家和计算机科学家提供了从事神经科学领域的入口。进一步的研究将这些网络与联想记忆之外的许多重要应用联系起来。这是我写过的被引用次数最多的论文(目前接近28000次引用,编者注)。甚至 AT&T 也很高兴(在此期间,我一直在贝尔实验室兼职),因为这项研究还为他们产生了一个经常被引用的专利,并加强了贝尔实验室的神经生物物理学和凝聚态物理学之间的联系。那现在怎么办?
在引言中,我将选择从事什么工作描述为从事研究事业中最重要的因素。本文的其余部分描述了遵循经验和调查的途径,这些途径导致了两个“问题”,这两个问题定义得足够明确,可以成为主要的研究领域。在每种情况下,我都会慢慢积累深思熟虑的过程和偶然事件的影响,这些影响塑造了我看待科学世界的方式,这种积累将塑造我在可能性之路的下一个岔路口的选择。“事后看来,事情似乎不可避免。我想写一本回忆录来解释生活是如何纯粹地依赖于偶然性的。”(D. Hare, 2015)。剧作家David Hare描述了他是如何创作出第一部戏剧的。当时,他是一位年轻的导演,有着强烈的政治倾向,从未想过自己成为一名作家。但当一位有抱负的作家未能提供承诺的剧本时,Hare挺身而出,在四天内写出了《布罗菲成功了》,作为他的演员团队在下周排练并在下下周演出所需的新剧本。读到这个叙述,我强烈感觉到“那就是我!”。我的一个“剧本”最终被命名为“一种减少需要高特异性的生物合成过程中错误的新机制”。一系列不可预测的事件让我从童年时从物理学家父母那里接触到“物理世界”,到凝聚态物理学,再到康奈尔大学和贝尔实验室,再到蛋白质化学物理学,最后在普林斯顿大学教授一门我背景太少的课程。我对学生讲课主题的需求与Hare对他的演员讲课的需求一样迫切。之前从生物学讲座中获得的机会,从凝聚态物理学中获得的一些随机知识,让我有了开始撰写这部“物理学家剧本”初稿的必要条件。在那一年教学之前,我从来没有想过自己会有这样的研究方向。我在科学领域所做的一切完全依赖于相关专家的实验和理论研究。我非常尊重他们,尤其是那些愿意尝试与非该领域专家交流的人。我只想补充一点,专家往往善于回答问题。如果你足够大胆,那么问问自己吧,不要太担心你是如何找到问题的。编:孙仲,北京大学研究员
原文:https://pni.princeton.edu/people/john-j-hopfield/now-what