AI 进入教育,这里头到底有没有真正的新鲜事?
早在 ChatGPT 面世之先,Sal Khan(可汗学院创始人)就收到 OpenAI 的邀请,参加了一个视频会议,他甚至还必须为此签订了一份保密协议:会议上,他同当时还无人知晓的 GPT-4一起做了一套生物试卷——这彻底改变了他对于 AI 在教育中价值的判断。
因为那份保密协议,那时的他还只能同极少数的人讨论他的想法,比如比尔·盖茨。“我们俩就像小孩子收获一个超酷玩具那般兴奋。”
而对于 OpenAI 这边,他们急需一个极好案例来证明这项技术的积极意义。所以他们找到 Sal Khan,希望 Khanmigo 能伴随 GPT-4一起推出。
近日,果壳与可汗学院创始人 Sal Khan 进行了一场对话。得益于他新书(《教育新语》)的发布,他如今可以披露出更多当时同 OpenAI 协作的细节,以及他对于 AI 在教育中(尤其是未成年教育)应用的一些原则。
教育里没有新鲜事,但 AI 的确有。多模态、拟人、推理,目前 AI 能实现的一切都不是结果,而是刚刚开始,Khan 反复告诫家长和教师:必须主动,比孩子们更主动,比那些用 AI 作恶之人更主动。
Q:在 ChatGPT 出现之前,OpenAI 就找到你测试了 GPT-4对吧?因为比·尔盖茨说,GPT-4得通过 AP(美国大学先修)生物学考试来证明它的表现。为什么非得会做 Biology AP 试题?能不能聊聊当时发生了什么?
A:这件事儿很有趣。2022年夏天,OpenAI 第一次联系我们时,也是在一个视频连线上,就跟我俩现在一样。我当时不知道为什么他们给我一道 AP Biology 题目,让我作答。然后 AI 也答了一遍,把问题选项解释了一遍。说实话,我震惊了,这是我第一次看到能推理的 AI,而不只是说些毫无意义的话。
第一次看到能推理的 AI,而不只是说些毫无意义的话丨Giphy
几个月之后,我就见到了比尔·盖茨,他告诉我,OpenAI 给他看 GPT-3的时候,他觉得很酷,但只有 AI 能通过 AP 生物学考试时,他才会信服。
我认为他当时这么说,是因为能通过 AP Biology,知识面得广,得懂细胞构成,DNA、RNA 这些作用等等,还得做逻辑推理,数学运算等等。它表现得并不完美,但确实是第一个擅长此类评估的模型。
Q:盖茨基金会是你们(可汗学院)早期的支持者,你和盖茨的关系也很好。当时微软一直在追加对 OpenAI 的投资(ChatGPT 发布后,微软又投资了100亿美元,有消息称谈判在2022年10月就开始了)。
A:从2022年夏天到年底的那段时间,除了 OpenAI、可汗学院和微软里的一些人,没人知道这项技术(GPT-4)。那次,我去比尔家里给他介绍可汗学院的近况,晚餐前,只有我和他两人在闲逛,聊到 GPT-4时,那种兴奋感就像小孩子刚发现一个超酷玩具。因为我们不能和其他人讨论这项技术。我们这些不同的利益相关者要做的事情恰好这样联系起来了,一个很有趣的“命运转折点”。
Q:所以你们的态度一下子变了,对于在此之前 AI 写的东西,你的评价是“毫无逻辑、毫无意义”。
A:是的,GPT-3写的文章,你打眼一看好像还不错,但你真正读起来,你就会发现是挺有趣的,但没多大意义。
GPT-3.5的出现对很多人来说是一个惊喜。我记得 ChatGPT 发布的那天,是2022年11月30日,我给 Greg Brockman 发消息,我问他怎么回事,GPT-4理应还没推出,我们之前还签了保密协议,不能跟任何人提起,这才过几个月,你们就发布了。Greg 说,没有,我们只是在3.5模型的基础上放了一个聊天界面。这让几乎每个人都关注到了 OpenAI。
它表现比 GPT-3模型好得多,而且又有一个聊天界面让人们意识到大语言模型能做什么。之前人们不太知道,没有很好地利用大模型。
Q:说到 AI 在教育里能做什么,你的观点是“AI 不能替代老师,但是 AI 可以成为一个私人助教/导师(tutor)”,所以这也是 Khanmigo 在做的。
A:是的,甚至可以追溯到有 AI 之前,当 Khan Academy 刚出现,别人就问我,你在做线上视频,在做能提问和反馈的教学软件,是为了以某种方式取代老师吗?我从一开始就非常清楚的一件事是,如果我不得不为自己、我的孩子、任何人的孩子,在“了不起的老师和没有技术”,或“了不起的技术但没有老师”之间做选择,我会选择前者。因为无论技术变得多好,形成人际关系能力总是重要的。
理想状态是不必做权衡,但现实并非如此。所以我们想同时提高“下限”和“上限”。
“下限”是指,为那些接触不到所需教学资源的学生,仅通过一部便宜的智能手机和互联网,就能开始学习。“提高上限”更接近因材施教的理想状态。一个班20、30名学生水平参差不齐,老师也想因材施教教学,但做不到。问题从始至终都是那些,AI 提供了更多解决问题的工具,如何满足个性化需求,如何将这些信息提供给教师端。
助教能做很多事情,包括回答学生问题、起到激励的作用。可汗学院成立于20年前。故事开始于,我当时是一家对冲基金的分析师,晚上会远程线上辅导我的表亲,我住在波士顿,他们住在新奥尔良,所以那个时候我就是他们的导师。那时候我不仅上课,还得给他们提供“情绪价值”,激励他们为自己的学业负责。
我设想,“不知疲惫”的 AI 能做得更多,AI 将教师和家长也参与进来——就像我给表亲的妈妈打电话时,我说,既然我不在他们身边,得换你们提供情绪价值。教育里要做的事情有无限多,如果技术能在里面分一杯羹,就能解放老师和家长,让他们做更多“更高层次”的事情。
与教师交流时,他们会流露出对于被 AI 取代的担心,我都让他们放心,我认为教学是 AI 世界里最安全的职业之一。假设你的校区用10亿美元雇了一批助教,他们帮你为论文评分、编写教案、在课堂上来回走动着照顾到有疑问的学生,他们深度了解每一位学生,并梳理好每一份学情报告给你。所有教师都会喜欢,因为他不能同时为一个班级的人做到这样。
我想说这就是 AI 要做的事情。你就不会认为 AI 会取代你了,反而你会因为技术的存在而得到提升,成为“指挥家”。可以说,任何能用得上人际关系的地方,AI 都得靠边站。
Q:所以你很早就在思考“AI tutor”该怎么做了,就像 Khanmigo 比 ChatGPT 更早上线了“记忆功能”。
A:是的,一个优秀助教不应该是“当你想问啥,它回复一下,然后下一次忘记上回聊了啥”。它应该记住你的好奇心和兴趣,然后基于这些对往后你的提问给出推断。
我从不认为,AI 能无限逼近做到人类能做的事情。但是这一代模型让我们惊讶,如果你给的提示词恰当,它真得能微调语气,对于 Khanmigo 来说,它能有多变的人格,有趣、古怪、善解人意等等。我知道,人们对于 AI 是否该被拟人化这一点一直在争论,一些创造出来 AI 情侣,这会是好事,也会变成坏事。但我认为,在教育里,任何能用来减轻压力并提高学习参与度的,都会是积极的。
Khanmigo 已经具备基本的文本输入功能,语音 - 文本 - 语音功能,就像我说的,高级语音功能和多模态功能将在未来一两年投产,AI 能检测出你的语气、能洞察你、感受你。只要我们谨慎使用,可能成为一项了解学生学习信心的非常有效的方式——是犹豫不决、是自信、是沮丧,这只会让 AI 成为一名更好的“tutor”。
Q:说到 Khanmigo,Khanmigo 最早一批接入 GPT-4,OpenAI 提供了哪些支持?
A:是的,他们不仅开放了接口,而且他们真的想 GPT-4和 Khanmigo 一起推出(2023年3月14日 GPT-4发布,3月15日 Khanmigo 发布)。用他们自己的话说,这个模型将打开人们的思维,让人们意识到生成式 AI 能做什么,但它也可能很可怕——人们很容易想象 AI 糟糕的应用案例——深度伪造图像、欺诈、假消息,其实人们已经在这么做了。但是我们也想证明是有很好的应用的,不仅是理论上的,就如 Khan Academy 这样人们信任的非营利性组织在实际使用。
包括在医疗领域,AI 将产生一系列非常积极的用例,用于 R&D,药物研发。
但我认为,我们在做的事情——用 Artificial Intelligence 来改进 Human Intelligence、改善“人类使命”(human purpose)是最有趣的。这就是最早我们如何一拍即合的。
Q:AI 会如何帮助学生管理分配时间、精力?现在学生都是接入互联网在线上课,你们会用类似浏览器插件来检测并计算学生上网多久了,都干了什么,然后用学习时间换取娱乐时间之类的吗?
A:还没有,但我们在做了,我相信也会有其他人会做。
在生成式 AI 之前,社交媒体、网站、广告商就一直在使用(决策式)AI 让我们沉迷,有据可查的结果是,我们更加焦虑、沮丧、两极分化了。最新的生成式 AI 技术,尤其是多模态能力、视觉能力,让它们实际上有可能充当“守护天使”。
没有应用在哪个领域的大模型像教育大模型如此关注“情绪”丨Giphy
我希望有一个内置于设备中,操作系统级的生成式 AI,能看到孩子在设备上做什么,并时刻通知我和我的妻子。而且系统级的 AI 能更好的设定规则。比如10岁以下不适合看的内容就不展示,如果是一篇关于战争话题的文章,可以生成摘要,而不是展示整篇文章细节给孩子读。还有,正如你提到的,在孩子完成1小时学习后奖励浏览社交媒体20分钟。这没有理由不发生。
这(绕不开的规则设定)比“选择给孩子看什么”要好得多。今天,人们唯一能做的选择是,是设置防火墙,选择哪些网站能看,哪些不能看。但是,今天大多数孩子都知道如何绕过去。
Q:但这关乎学生个人的信息透明度问题,学生是否愿意与家长分享他们在做什么。学生一点隐私都没有了,这就走向一个极端了,不是吗?
A:是,你要知道我们从一开始就采取保守立场。如果学生未满18岁,我们要求老师或家长进行监督。的确会有15、16岁的孩子想在没有父母在场的情况下和 AI 交谈,但现在这不会在 Khanmigo 上发生,特别是 Khanmigo 进入学校环境里使用,学校、老师也能访问到数据。
但我强调,除了学生、家长、学校老师,我们不允许数据用于训练公共模型,无论是下一代的 GPT-5、Gemini2或其他。我们会对个人身份信息进行匿名化处理,非常小心地保护数据。超过18岁的学生显然不需要监督了,但我们仍然会保护他们的数据。
我一直告诉可汗学院的团队,我们依赖人工智能这样技术的原因是,这些工具能帮助我们比以往任何时候都能更好地完成免费、世界一流教育的使命。我们没有股东,不背负盈利指标,我们努力创造对社会的积极影响,15年来都是如此。
如果我们不做,你看到了,已经有数百家初创公司进入这个领域,其中一些营利性公司没有以完全正确的方式做事。人们已经害怕 AI 了,有害怕,就会有逃避。一旦消极产生,人们就会错过积极的一面。这就是为什么,要一个值得信赖的组织来做如此重要。
Q:你在很多公开演讲中都表达了。当然你认为设置好“安全护栏“是前提,刚刚你谈到的那些都是“安全护栏”吗?
A:主要的一些护栏正如我刚才说的:AI 不应该用来作弊,AI 应该进行“苏格拉底式”(启发,循循善诱)教学;对待未满18岁的学生,AI 应该把教师和家长设计进监督的一环;
如果你尝试让 AI 指导你做些坏事——就像问它“炸弹怎么制造”、“我有自杀倾向”,它会通知大人;还有隐私,保护用户隐私,不分享用于训练公共模型。
总体来说,我乐观,是因为除了乐观,别无他法。技术总是会放大人类意图,说回老生常谈的,火燃烧,但会带给人温暖;刀能杀人,也是有利的工具,生成式 AI 也是一样。
我对那些试图放慢 AI 步伐或是制定了太多规则的人说:心怀不轨的那些人是不会放慢脚步的,么就相当于你们在将人类历史上最强大的技术推向了那些人。所以,那些想帮助教育、医疗、发现新药、推动科学前沿进步的人,只有真的投入,将积极意图放大,是压倒负面的唯一方式。
Q:所以这是为什么 ChatGPT 刚出来时,第一时间先是引起了学术界、教育界的禁止。因为人们还没反应过来,没来得及设置“护栏”,而好的案例也还没出现,后来 Khanmigo 推出,进入了很多学校。
A:ChatGPT 刚刚出现,对于学校如何使用它没有行之有效的观点,所以世界各地的学校都开始禁止 ChatGPT。事实上,作弊在 ChatGPT 之前就已经常见,不过是 ChatGPT 给了作弊一个新方法。
当 Khanmigo 发布时,我们意识到这项技术的强大,只要设置正确的护栏、教学法、监督、减少错误,它就能成为一个有效工具。所以,我们总体上收获了积极的反馈。
Q:上一波的 AI 教育,其实可以被总结为两点:“在线课程”和“个性化练习”,例如通过学情数据,了解到学生的薄弱之处,对其不断巩固,直到学生掌握这个知识点,你觉得最新的生成式 AI 技术能将“个性化练习”做得更好吗?
A:我觉得,会,也不会。AI 让教育变得更好,让教学内容更容易被吸收,但我不指望 AI 会解决所有问题。归根结底,即便是30、40年前,有学习动力、能得到教学支持的学生,即便只有教科书,那也足够了。而没有动力,即便有最好的真人辅导老师,去最好的学校,也于事无补。也许,靠教科书,5%的人能学习;有在线课程、可汗学院,20%的人能学习;AI 进一步提到这个比例罢了。
就像你问的,发现学生没搞懂哪个知识点,循序渐进地教学,以及察觉学生们之间的差距,这就是一个优秀导师会做的,无关形式——是在线教育,基于技术的教育,还是人类导师,关键是能做好吗?所以我们在让工具变得更好,输送给学校教师,因为我们看到一些工具能真正帮助教师时,教育结果会更好。
Q:随着这两年新的 AI 热潮,中国市场中教育硬件成了最火热的产品,你怎么看?
A:我们的一位支持者告诉我,他在中国时看到一些 AI 平板,印象很深刻,但是是一台仅在中国才能使用的产品,然后他寄给了我。我也看到了其他一些中国的教育硬件,确实我认为中国在教育硬件上的一些东西很领先。比如,平板电脑能看到学生在书写的内容,实施得当的话,也许真的对教育有帮助。
A:目前没有。但我们有一个提供给年幼孩子的学习软件,叫 Khan Academy Kids,用来教学早期阅读、写作、数学等等,非常适合年幼孩子拿着平板来学,我们可以与其他硬件公司合作,让这款软件运行得更好。
Q:之所以会问到硬件,是因为中国国内很多公司认为硬件是让教育落地的一个方式,同时能让家长心甘情愿为此买单。未来,教育形式和内容可能会变,学生可能不用盯着一个电脑上线上课,那新的形式会是什么?要不要依托于新的硬件?
A:未来人们怎么和 AI 合作,就会怎么学习。人们不必依托于一个带屏设备,想象它是一个 Alexa,或 Siri,通过和它聊天就能学习。不仅如此,它能连通三、四名学生之间同时对话。它也可以是带着摄像头的,它可以一边读你写的论文,一边跟你讨论,你学习的时候,不必一定坐在屏幕前。我相信未来很多来,会有很多在教育方面的试验。