专栏名称: Howie和小能熊
小能熊是终生学习的小能熊,是自我管理的小能熊。 小能熊专注于分享自我学习方法,分享时间管理、知识管理等自我管理方面的经验和思考。 一句话,小能熊,来自学习者,服务学习者。 热爱学习、希望提升自我的你,希望小能熊能成为你的好朋友。
目录
相关文章推荐
野球帝  ·  卧槽牛逼!10年了!网红球队,创造了历史... ·  11 小时前  
苏群  ·  杜兰特火气越来越大,快了快了 ·  2 天前  
苏群  ·  湖人残残阵有血性,输了也值! ·  4 天前  
51好读  ›  专栏  ›  Howie和小能熊

如何学会一切知识,不管它有多难?(以 ChatGPT 原理学习为例)

Howie和小能熊  · 公众号  ·  · 2024-04-23 18:34

正文

人活着就得学习。人在学习时,经常会发现很多知识“难学”,“难懂”,“难掌握”。

举个例子,ChatGPT 已经爆火 1 年多,大部分人都意识到这种技术对自己和孩子会产生颠覆性影响,也认同自己应该“懂”ChatGPT。但是,如何弄懂 ChatGPT 呢?如何学习并理解ChatGPT 的运作原理呢?人们发现这个有点难。

这种“知识难学”的现象是普遍且长期存在的,不论是小学生,还是青少年或者是成年人,总会发现有些知识很难学。中学时的数理化很难学,大学里的线性代数很难学,成年之后发现英语、编程、写作也难学。

在此,我提出一个问题与你一起思考:如何让困难的学习变简单( how to make hard learnings easy)?其他的表述包括:如何学会一切知识,不管它有多难?如何轻松学会一切难懂的知识?

之所以现在讨论这个问题,是因为我们已经论述完学习闭环的 4 个主要环节:知识体系、信息输入、笔记编码和生成输出。而学习困难的原因绝对不是记忆问题导致的。所以,我们现在可以对这个重要问题可以进行高层次(high-level) 的讨论和分析,形成一个全局层面的、高屋建瓴的、具有巨大指导意义和价值的问题理解和应对方案。

这件事是非常值得做。

为什么很多知识很难学?

先分析原因,为什么有些知识很难学,难懂,难掌握?

首先,客观来讲,很多知识本身就很难,例如量子力学,深度学习的原理等。随着人类文明的发展,人类知识必然会成为一个愈发丰富、抽象、高级的复杂系统,这是客观且必然的。

概念的抽象性和复杂性 一些学科或技能本质上就是非常抽象和复杂的,如高等数学、量子物理学、某些编程语言等。这些领域往往涉及难以直观理解的概念,需要通过抽象思维来掌握,例如,量子理论、弦理论。

先验知识的要求 所有知识都是相互关联的,高级的知识都是以基础知识为基础和前提的。所以,一些学科或技能要求学习者具备一定的先验知识基础。如果缺乏这些扎实的知识储备,学习就会困难重重。例如大学四年的课程安排是循序渐进的,前面的基础课没学好,专业课的难度就急剧加大。

知识的更新迭代 我们生活在知识爆炸的时代,很多学科和领域在快速发展,尤其是编程、AI等技术领域。领域快速发展,带来知识的快速更新和快速过时。学习者必须持续学习,才能跟得上发展节奏。

学习者本身 其次,学习者的能力和方法也很关键。知识本身已经很复杂,人还有各种各样的惰性和不足,例如学习目标不情绪,学习方法跟不上,没有强大的学习内驱力,没有求知欲……

低质量的学习资源 有的时候,学习的困难来自低质量的、设计糟糕的学习资料。例如,被网友们广泛恶评,甚至称为“教材界耻辱”的《线性代数》同济版教材。低质量的学习材料只顾罗列定义、定理、规则、例题、练习题,老师对着低质量教材照本宣科,期末拿一套低质量的多年不变的试卷形式主义考一遍,就算没挂科,学生也没学到多少东西,也没有形成理解。

虽然身在互联网时代,优秀的教材、MOOC线上课程、学习工具、书籍等唾手可得,从获得优质学习资料的角度,理论上每个学习者和盖茨、马斯克的孩子处在同一起跑线上,但是,很多人没有这个意识,也没有这个习惯。

理解之难 在具体的知识点层面,理解也是困难的。很多概念的抽象程度和复杂度很高,还淹没在学科知识体系的海量琐碎细节中,然后,使用频率还很低,于是,这就造成了学习的灾难。

重要的概念抽象难懂,不重要的知识琐碎复杂。例如,在IT、互联网、编程等领域,存在海量的琐碎的知识。例如,HTTP、DNS、Git、bash 脚本等主题,知识点实在太多了,学起来自然让人头大。

其次,传统的教学方法很多时候过于侧重理论,停留在照本宣科、单向灌输的层面,不强调主观理解、实践应用,于是,学生在学习了几年的电学和电子知识后,仍然不会接电线,分不清二极管三极管和电容电阻。只是听过了一些名词,背诵了一些定义和定理,用刷题方式掌握了一些解题套路,但是,根本没有形成真正的理解。

知识本身就很难,坑还多,还用不上,于是,就陷入学习的灾难。

实践之难 一个人没法在岸上学会游泳,很多知识和技能的学习也还如此,必须有大量的实践不可,例如英语、编程等。很多教育模式以及学习者的学习模式都是长期脱离实践、不以实践为导向的,缺乏输出,缺乏动手解决问题,于是,学习愈发困难。

学习者的动机和兴趣 学习是一个认知过程,但学习者的内部动机、兴趣和情感因素也极大影响学习过程。缺乏动机和兴趣,学习愈发困难。

学习环境不佳 家庭的学习氛围,班级的学习氛围,是否有学习小团体,社会的学习氛围,这些也让学习愈发困难。在短屎频和小红书广泛传播的环境中,静下心来阅读学习也愈发困难。

其他特殊原因 前面是我们识别出的导致学习困难的普遍原因,在具体知识方面还存在特殊原因,需要具体问题具体分析。例如,有些人的困难是时间管理问题导致的,有些人学编程时选择了错误的学习路径,大部分人学不好英语是时间投入不足,缺乏阅读……但整体来讲,上面的十来点覆盖了主要的学习困难原因。

举例:ChatGPT之难

鉴于本次深度学习革命的影响之大,我们继续以ChatGPT的学习为例。

2013年末,在ChatGPT发布一年以后,我以为自己已经很懂ChatGPT了,毕竟每天都在用。然而,在跟一个亲戚聊起ChatGPT 的时候,我发现自己对ChatGPT为什么能做到这些还是不甚清楚,说不清楚为什么 ChatGPT 能够做到几十种人类语言的高质量翻译,说不清楚 GPT 模型内部的 embedding 过程和注意力机制到底在做些什么。我发现,对 GPT原理形成清晰的概念性理解还是挺难的。

ChatGPT 和深度学习的相关知识,就是典型的难学的知识。这些知识本身属于AI这个发展了半个世纪的学科,与机器学习、概率统计等知识有密切联系。这些概念和原理本身就抽象复杂的,有先验知识的要求,但是,我们平时接触的都是网上看到的只言片语,于是,理解变得困难。

而且,除非是少数的从业者,大多数人没有这些知识的使用场景,虽然想学习想弄懂,但是动机不强,使用频率极低,于是经常浅尝辄止,遇到困难很快就放弃,停留在间歇性努力的状态。

于是,虽然从 AlphaGo 之后就知道深度学习影响巨大,从 ChatGPT 之后就认识到深度学习革命已然来临,这一轮 AI 必然颠覆我们过去的工作学习模式,但是,大部分人仍然只是知道一些名词概念,并不理解,不具备体系性知识,自然也无法形成深入的认识,无法用这些知识来解释世界,解决问题。于是,虽然 GPT对普通人的学习和教育构成颠覆式冲击,但是人们实际上并不理解这个结论实际上意味着什么,不知道以后的孩子应该怎样学习,父母应该怎样改变,成年人应该怎么办。

如何让困难的学习变简单?

分析完学习困难的原因,问题来了:如何让困难的学习变简单?

以学习闭环作为元方法

我们以学习闭环为思考框架,顺着学习闭环上的各个环节来逐个分析。

知识体系环节

这个环节的根本矛盾,是知识体系的客观复杂度与学习者的主观应对方法不够好之间的矛盾。

知识体系复杂,先验知识的要求高(需要按部就班,拾级而上),概念抽象程度高,领域内知识更新迭代速度快。这都是客观因素,不以个人意志为转移。也就是说,客观知识的问题,需要在主观层面解决。

怎么办?

必须从教导主义视角下的被动灌输,转变为建构主义视角下的主动学习 ,在学习这件事上,成为一个“新造的人”。

解决方法很简洁: 知识树学习法 。有效学习离不开个人知识体系,把知识体系构建化整为零,变成可以轻松搞定的、bite-size 的学习。

我总结了一下 知识树学习法在解决知识复杂问题上的优势

首先, 主动构建 ,解决知识太多的问题。知识体系再复杂,从 最小可行知识树 做起。从最简陋的 2W2H框架开始,让知识树不断生长,抽条,开花结果,知识体系复杂的问题会在不知不觉中被克服;

其次, 学习目标 方面,解决了很多学习者没有学习目标,学习目标模糊,不合理的问题。短期以知识体系为目标,长期以解决问题、学以致用为目标。

第三, 轻重缓急 ,解决细枝末节、不重要知识的难题。重要的知识,就是与其他知识的关联更多,联系更紧密的知识,必然会在知识树中居于中心位置,而且频繁出现。不重要的知识,必然在知识树上出于树叶级别,在隐秘的角落,出现频率低,于是,琐碎的知识细节就不会占据过多精力,宝贵的精力被聚焦在关键知识上,用自然而然、毫不费力的方式解决了知识的轻重缓急问题。

最后, 逐步优化 ,解决知识理解太难的问题。知识树上的每一篇树叶、枝杈都是长青的,都是不断迭代的。用知识树方法来学习,你自然而然不会去追求一次性的理解,而是在不断的迭代过程中逐渐加深理解,即使是最复杂的知识,也会在逐步优化的过程中被弄懂和掌握。

实例:GPT知识树

例如,在针对深度学习和GPT建立知识树之前,这个领域的海量知识、概念、想法、案例、工具都杂乱地堆在脑子里,分散在一系列笔记中。

但是,建立了“深度学习bok”和“GPT知识树”这两个bok类笔记后,我对这两个主题建立的知识框架就越发清晰。哪怕现在的知识体系框架不够“完美”,但是,够用就行,个人知识体系会跟着认识和实践的深入而持续生长。

在 GPT的知识体系中,embedding 和注意力机制都属于比较抽象、不太好理解的概念。但是,当他们在知识树上频繁出现,你接触的次数多了,不知不觉查阅的相关资料也多了,高质量资源也多了,理解也自然而然加深了。

信息输入环节

这个环节的根本矛盾,是低质量信息泛滥与学习者不占有高质量学习资源之间的矛盾。

在学习这件事上,garbage in, garbage out是属于第一性原理级别的存在。

举个例子,即使对于GPT这样的大语言模型,假定算力充沛,算法一样,数据质量的影响都是决定性的。毕竟,2023 年 3 月发布的 GPT-4 并不是第一个万亿参数大模型,两年前就有公司发布了十倍于 GPT-3 的 1.75 万亿参数大模型。但是,如果你当时试用过的话,这个人工智障应该会让你直呼上当。其中一个原因应该就是训练数据的质量不高。GPT 模型只是把人类语言文本中的意义像榨油一样提炼出来,然后压缩并封印到千万亿的参数中,但是,如果学习资料本身就是垃圾,那你并不能从垃圾中学的多好。

所以,在这个环节,学习困难的解决方案也很简单: 设计你的学习数据集 。GPT的学习,需要精心设计训练数据集;你的学习,需要精心设计学习数据集;选择合适的学习资源,从易到难,从具体到抽象,拾级而上。

精心设计的、优质的学习资料,会极大降低学习难度,让学习变得如沐春风。我总结为“小大大长”:

  • 册子(introduction):用小册子轻松入门,快速上手;






请到「今天看啥」查看全文