专栏名称: 普通人的AI自由
AGI降临的世界中,我们每个人的自由向导。
目录
相关文章推荐
李楠或kkk  ·  为什么你要搞 7 个 macmini ... ·  3 天前  
班主任家园  ·  100句除夕文案,最适合发朋友圈! ·  4 天前  
艾锋降级  ·  好消息!iOS 18.3 ... ·  4 天前  
51好读  ›  专栏  ›  普通人的AI自由

AGI时代的教育(上):黎明前的试错

普通人的AI自由  · 公众号  · 科技自媒体 教育  · 2025-02-01 15:30

主要观点总结

本文讨论了AI在教育领域的应用及其影响。文章指出,虽然AI提供了很多便利,但教育不仅仅是获取知识,还包括人文精神和创造力的培养。文章还提到,随着AI技术的发展,我们需要重新思考在AGI时代应该学什么。文章分为几个部分:<2024年的AI教育现状>、<AI在教育中的局限性>和<AI与教育的未来>。

关键观点总结

关键观点1: AI在教育领域的应用

AI在教育领域的应用包括题库生成、语言学习、解题类APP等。虽然AI提供了很多便利,但当前的应用还存在很多局限性。

关键观点2: AI在教育中的局限性

AI在教育中的应用往往只是传统教育的延伸,只是多了一层AI生成的外壳。AI无法替代人文精神和创造力的培养,也无法成为人的榜样。

关键观点3: AI与教育的未来

随着AI技术的发展,我们需要重新思考在AGI时代的教育应该如何变革。真正的教育需要引导学生经历思考、推理和探究的过程,而非被动接受信息。同时,我们也需要思考在AGI时代应该学什么。


正文

太长不看版
  • 我们希望AI提升教育质量,但AI目前只提升了题库数量

  • 受制于AI能力,当前AI教育产品局限在语言学习和题库批改

  • 多邻国是休闲小游戏,并无法达到语言学习的目的

  • 2025年的技术进展会让AI教育产品再上一个台阶

  • AI+教育 ≠ AGI时代的教育

  • “AGI时代应该学什么”才是更本质的问题


by Oleg Buevskiy

作者:Yuchen,Huiyi,Sylvie,Lian;视觉:Yuhui

【正文】

<1>

2024:雕花与挂羊头


子女教育是东亚父母生活的圆心。

“苦了自己也不能苦孩子。”

即使是经济下行期,教育消费也一直是常青树。


于是,AI+教育的概念也同样受到资本青睐。从a16Z发布的24年全球Top50 AI产品榜单看,狭义的AI教育产品(Edtech)共上榜7个,是除了AI助手&赔聊、内容生成之后最大的品类。从另一个角度看,AI+教育更是唯一上榜的AI垂类行业。

数据来源:a16z,按月活人数排序
AI给了教育跨时代的想象力。AI大语言模型所展现出了广阔知识面、强大的理解与对话能力,让我们都觉得“AI老师”似乎距离我们不远了。这个“AI老师”应该是“超级大脑”+“陪伴互动”+“个性规划”的AI老师。“因材施教-个性化教育”终于有了成为现实的可能性。

但AI+教育的现实和我们的期待南辕北辙。
仔细看来,AI+教育并没有在做教育底层逻辑的创新,而仅仅把AI作为一个提效工具来做雕花。
我们希望的是“提升教育质量”,但AI做的是“提升题库数量”;
我们希望的是“掌握新技能”,但AI却引导我们玩游戏、看广告。
当我们扒一扒AI+教育榜单的前几名,就会发现它们的成功一方面与AI关系不太大,另一方面也并没有在解决教育效果的问题。它们反而是披着教育的外衣,通过挖掘人性中懒惰、攀比、自恋的弱点,来换取流量。
AI×教育产品数据

多邻国:披着教育外衣的休闲游戏

多邻国是AI教育赛道DAU最大的APP。它使用AI的主要方式是题库生成;在2024年上半年,它甚至成为OpenAI API调用前三的APP。

多邻国的本质并不是教育产品,而是一个休闲游戏。

多邻国成功的最重要原因一是多巴胺投喂机:每道题目之后马上给予评价和奖励;以及利用戒断反应,通过反复提醒和积分体系给用户压力来提升粘性。多邻国中国区产品负责人曾表示,通过AI算法,多邻国将用户答题的正确率维持在80%左右。高于这个正确率用户可能认为过于简单反而不再学习,低于80%则会因为难度而产生抵触心理。按照这个策略,永远80分就可以永远获得满足,永远使用产品。

二是焦虑安慰剂。步入职场之后就会逐渐发现:学习新技能的时间和精力都日渐不足。
作为“曾经的好学生”的白领们,最引以为傲的就是“学习能力”。而一直以来“不进则退”、“终身学习”这些自己给自己打的鸡血在此时却成为了莫大的焦虑和恐惧:我们开始质疑自己的学习能力,进而质疑自己未来的职业发展、人生成功。于是,多邻国便乘虚而入,成为了延续“学习能力”的安慰剂。它足够简单上手,给我们带来虚假的安全感。
三是社交攀比。和上面一样,发到群里、朋友圈来“卷别人”,延续“积极向上”、“热爱学习”的好学生人设。
但是学习真的可以“无痛”吗?或者说,“无痛”的真的是学习吗?我们看到,多邻国最多可以做到语言入门,但最多只能达到A2水平(最基本的日常对话,最低“生存要求”,无法表达复杂/没练习过的内容)。
如果玩多邻国的时间真正用来语言学习,我们完全可以做到更好。

解题APP:偷看答案/被大厂卷

随着AI能力的进一步提升,2024年中出现了另一大类的AI教育应用:解题。在这类APP中,数学解题最早出现,一方面数学的需求最集中,集中提升AI的数学能力投资回报高;另一方面是数据答案标准化,AI强化学习的难度相对较小。我们看到榜单中前几名的PhotoMath, Mathway都是以数学解题为主要功能。
这类APP的基本思路是拍照->AI识别题目->AI给出答案。实际上,它们满足的最大量用户刚需是抄答案:就像小时候抄习题册最后的答案一样。
这里的风险在于:当学生习惯了用AI作为捷径,反而失去了锻炼和成长的机会。当然,我们不应该完全否认这类APP的用处,尤其是下半年大模型能力进一步提升,给出解题步骤之后。
同时,这类APP面临的严峻的大厂挑战:OpenAI o1, DeepSeek R1, Anthropic Claude3.5 Sonnet 这些强推理能力的模型已经可以很好解决竞赛级别的数学和物理问题。因此,解题类APP仍然需要在产品上建立护城河。
Image: PhotoMath

可汗学院:理想丰满,落地骨感

“因材施教”是所有教育者的理想,也是全球最大的在线教育平台之一可汗学院(Khan Academy)一直高举的旗帜。AI的出现,更给了一针强心剂,似乎“个性化教育”真的距离我们不远了。然而,理想很丰满,现实很骨感,可汗学院与多数眼高手低的大平台一样,期望很好,而落地还是吃灰的“视频资源仓库”
可汗学院介绍

大模型出现后,最被寄予厚望的应用方向便是“个性化学习”,但这对于目前模型的能力要求还太高:一个“好的AI老师”需要通过有限的学生行为数据(例如错题次数、答题时间、学科偏好、思考方式等),对其深层的逻辑、性格、喜好等做出推理和预测,从而给出学习的“最优解”。

而目前市面上的所谓AI“个性化学习”、“自适应课程”还是停留在数据打标签+推荐系统的老路;而并非利用大模型能力做深度推理和预测。

以“AI错题总结分析”为例,在理想状态中,AI通过长期追踪作业错题,可完整描绘出学生的薄弱知识图谱,发现学生解题误区,帮助精准提升。实际上,大部分的现有产品的做法是:首先用AI或人工为题目打上知识点标签,并预先准备好题库。在使用过程中,AI仅负责统计知识点的错误次数,无法归结学生解题思维和习惯上的底层错误,难以像一位经验丰富的教师一样帮助学生“点拨解惑”、“举一反三”。

但“自适应课程”不仅要掌握学生个人的进度和难度,还要主动生成合适的教学内容。现阶段AI尚且没有能力稳定无误地“即兴创作”教学内容,所谓的“自适应”也只是人类制作 “难-中-易”几个版本的教学内容和题目,AI根据学生进度切换难度。

by Yukai Du

<2>

2025:爆发前夜


不能说是产品经理不努力,AI的能力限制也是重要原因。

因此, 我们看到当前AI在教育行业的应用也是在尽量使用AI的长板,而受制于AI的短板。

自由对话。语言的对话、续接、翻译一开始就是模型训练的目标,因此第一批出现的AI教育产品就是语言练习。但这类产品大多还停留在最简单的“GPT套壳”状态,在2024年上半年大家追捧GPT的时间纷纷上线,但在下半年就没有了什么声音。

其中原因是“一个会说话的外国人”和“一个会教英语的外国人”之间存在很大差距。外国人可以提供语言环境,这对年龄较小的宝宝可以有效,但对于成年人学习却效果一般。成年人语言学习需要教学方法:它包含了如何设计课程、激发学生兴趣、平衡死记硬背和寓教于乐的互动能力等。

这类产品之所以鸡肋是因为APP的产品形态不适合幼儿,而内容又不适合成年人语言学习。这也是为什么它们无法再往前走的原因。

照猫画虎——题库生成。熟悉Prompt Engineering的朋友一定知道,让大模型吐出稳定答案的最好方法就是“举个栗子”:让大模型参照案例生成。这一点用在题库扩充上最好不过了。于是,最大量的AI+教育应用实际上是题库生成。

情绪价值。多邻国是最好的案例。

数学与解题。AI加持的解题类APP击中了学生的应试刚需,短期变现能力强。但在这个场景中,AI老师“答错”的负面影响远大于“答对”,AI幻觉-出错的问题会一直存在。

R&G Telecom by Denis Freitas

2025年的AI技术发展,让我们看到了更多希望

数学AI。“通往AGI,数学可能是语言之外的另一块拼图”。这也是2024年下半年开始,各家大厂开卷数学能力的重要原因。随着各家的大量投入,到24年末,模型的数学与逻辑能力已经有了长足进步:几乎达到了竞赛水平。我们在2025年马上就会看到,AI在IMO等国际数学赛事上打败人类选手。数学家陶哲轩也认为:“如果使用得当,到2026年,AI将成为数学研究和许多其他领域值得信赖的合著者“。这些能力的提升,将进一步提升模型数学-科学类问题的解题能力。

推理能力精进。GPT o1, DeepSeek R1 这类模型最大的进展在于推理能力的精进,而当前取得的进展仅仅是开始。DeepSeek的例子更是告诉我们,即使在数据量-参数量不增加的情况下,推理进步的天花板仍然很高。在教育领域,多步推理的过程正和解题与教育的过程相符合。当模型可以自动识别纠正自身推理错误时,就一样可以一步一步地引导学生得出答案,更好指导学生进步。

多模态理解与生成。教育中重要的不仅仅是知识的正确与丰富,更是教育方法与知识的呈现表达方式。随着多模态理解与生成能力的进一步进展,根据具体情况实时、多角度生成教育素材将进一步提升学习效率。Infogram等更容易理解的信息形式将可以更容易的生成。

以及,在AI生成内容进一步爆炸的年代,筛选的价值要远远超过内容本身。其中一个思路就是如何利用AI帮助个人筛选内容,实现学习目标。

实时语音对话。GPT 4o已经向我们展示了AI语音对话的强大能力,但当前在延迟和成本上还不足以大规模应用。不过我们可以预见这个技术在2025年应该可以走向成熟:这时候,或许个性化的AI老师便可以开始走进家庭。

Illustrations for the Polytechnic Museum by Katya Dorokhina 

<3>

AI+教育与AGI时代学习


当AI捷径成为常态,何来成长?

哈佛大学教育学院教授Christopher Dede在公开讨论中提出:“生成式人工智能在教育中的应用存在一个风险,即它可能缩短这一学习旅程,导致学生不再经历完整的学习过程。”

懒惰是人的天性,当一个学生可以轻松地通过AI得到一道题的答案的时候,他会选择捷径——直接抄写答案,还是绕更远路——仔细研究得到答案的过程呢?

学习的本质不是得到答案,而是经历提问 - 寻找线索 - 进行推理 - 得到答案的过程,在这个过程中锻炼的底层能力才是教育的目的。有些南墙需要自己来撞。而当AI帮你规避了所有南墙,直接让你通过捷径走到终点的时候,你也失去了在路程中锻炼与成长,让自己成为更完整的人的机会。


AI促进教育公平?现实还是幻象?

AI大模型在教育行业的逐渐渗透,能不能促进教育公平?虽然AI可以让人无成本地、公平地获取“教育素材”,但当今教育公平性的问题已经远远不是“缺乏课本”这么简单的问题。

“大模型就像一个照妖镜”:回答质量依赖于用户的提问能力。就像前被广泛讨论的“9.9和9.11谁更大”,有人会真的相信模型的回复,有人以此嘲笑大模型的智商,有人会避免问这类模型不擅长的问题,有人会在prompt里控制模型的输出。

随着AI“智力”水平的提升,在“正确率”和“方差”层面都达到普通教师的平均水平后,学生在知识内容——或者说考试分数,应该可以通过AI提高。但当AI的“优化目标”是考卷分数,学生们是不是也会成为“困在算法里的骑手”?

但人生并不全由考卷分数决定:人与人之间的沟通、协作、共情能力;以及正直、勇敢、自信、坚定等个性品格甚至更加重要。这些能力很多是人类教师和家庭做为榜样所传达的。但AI本身没有这些“道德品格”,作为AI也无法成为“人的榜样”,那我们又从哪里去学到这些呢?


AGI时代的教育:何去何从?

AI的目标不应该是取代学习,而是促进学习。

当智慧变得廉价的时候,我们应该学习什么?

当前的AI教育仍停留在浅层,本质上只是传统教育的延伸,只是多了一层AI生成的外壳。AI可以成为高效的学习助手,为学生提供即时反馈、个性化学习路径,并拓展知识视野。但它不应成为捷径,而应作为思维的催化剂,帮助学生更深入地理解问题,而非简单提供答案。真正的教育,仍需引导学生经历思考、推理和探究的过程,而非被动接受信息。

AI将会让知识和教育素材无限量供应,此时最重要的的问题就不是“如何学的快?”,甚至不是“如何变聪明?”,而是“应该学什么?”

选择比努力更重要。

以及,尽管AI优化了知识获取,它却无法取代教育中最重要的部分——人文精神、创造力和价值观的塑造。它或许提高考试成绩,却无法教会学生如何与人协作、如何在不确定中做决策、如何保持求知的热情……以及,AI带来的智慧终究是AI的智慧,或者说是少数大公司的智慧,而不是个体的智慧。

面对AI带来的变革,我们必须回归根本,重新思考一个关键问题:

在AGI时代,我们究竟应该学什么?

下篇文章会详细展开。

敬请期待,也欢迎关注、标星、转发。

Time Stretched NO.17