教育一直被认为是会被LLM改变最大的行业之一。ChatGPT 的使用场景中,教育占据了很大比重,其用量常随开学和假期规律波动。而 Andrej Karpathy 也选择了教育作为他的创业方向。人们都期待能够有全能的AI Tutor,因材施教,提供给每个人最好、最个性化的教育。
虽然 AI Tutor 的理想还没有实现,但随着 LLM、Voice Agent、多模态理解和 o1 等 AI 能力的不断提升,创业公司在教育领域解锁了越来越多的应用场景。LLM+EdTech 的核心,是将传统教育服务转化为产品。这一趋势在语言学习、拍照搜题等细分领域尤为明显。例如,基于 LLM 和 Voice Agent 的语言导师,通过自然对话提升降低外教门槛;基于多模态理解的拍搜应用,为基于图片的问题提供了更精准的解答。o1 的推出也为数学和逻辑推理相关的学科场景打开了新的可能性。
而应用层创业公司的价值在于提供 ChatGPT 等大模型做不到的体验——提供更懂用户需求、更贴合实际场景的功能。例如,通过优化产品设计,让用户更愿意在产品中互动,获得更直接的反馈。
本文是我们对于 AI & Edu 赛道的 mapping,我们始终对AI对教育行业带来的变化充满期待,这体现在教学的各个环节中。Class companion 就是一个典型的例子。初高中教师没有时间批改课后的 written assignment,使用class companion, 教师可以在 LLM 的帮助下设计作业,同学们在作业提交的一瞬间,就能得到AI的反馈。Class Companion 面向学区和教师的 ToB 进校软件市场,采用PLG的方式,通过教师口碑推动学校的采购。然而,作为细分场景下的工具,Class Companion 也面临被大型进校软件供应商挤压的风险。即便如此,这一案例表明,只要找到合适的应用场景,现阶段的 LLM 已经能够释放出足够高的教学价值。
01
AI & Education 赛道纵览
教育产品可以根据目标客户是学生还是老师进行简单划分
。面向学生的产品主要包括语言学习应用(如 Duolingo)、作业帮手(如 Chegg 和 Quizlet)、职业技能培训课程(如 Coursera 和 Udemy),以及幼儿教育类工具(如 Ello)。产品的打磨和高效触达C端用户非常重要。2023年,全球EdTech市场规模达1460亿美元,预计到2033年将增至5496亿美元,其中针对学生个人的市场占比约70%。
面向教师和学区的产品包括学习管理系统(如 Google Classroom)、学生信息系统(如 PowerSchool)、课堂管理软件(如 Classcraft),以及评估软件(如 Gradescope)。这类产品的成功主要依赖于团队的销售能力和教育体系内的资源,主要付费方为学校和教育机构。虽然市场规模较学生端小,但增长很快,2023年市场规模约为185亿美元,预计到2032年增至1324亿美元,年均复合增长率达25.2%。
LLM 的到来,为解锁更为个性化、即时性、互动性的教育场景提供了机会。
由于教育资源有限,无法做到让每个人随时随地获得最适合自己的教育。教育行业的几次迭代:在线教育平台、学习资源网站、学习 app 都是对教育资源不足的弥补。LLM 进一步丰富高质量教育资源的供给。
To Students 最主要的是 7/24 AI Tutor,包括语言学习、数学、代码等细分领域的专业化 tutor。如针对语言学习的 Speak、Praktika、Duolingo,主要针对数学解答的 question.ai, answer.ai,全科 AI Tutor 如可汗学院推出的 kehamigo,Chegg study 的 cheggmate,字节的 Gauth。同时还包括针对 kids 的 early reading/curiosity coach,如 ello。
其他还包括一些心理支持、大学/职业顾问的应用场景。To teachers & class room 产品划分为教学前,教学中,教学后。教学前用于课程生成、教学建议;课堂中的促进互动,帮助教师对学生学习状态的实时掌控;课后帮助作业批改,对学生的评估与反馈。例如 OpenAI 投资的 class companion 就是专注课后 written assignment 批改的一款 saas 产品。
语言学习和儿童教育应用已经发展的较为成熟
,因为对实时互动的需求较高,但对逻辑和精确性要求不高,对模型智能要求相对较低。
数学/编程 AI Tutor 等精确要求度高、强调解题逻辑的学科,对模型智能的要求较高。
仍以传统的拍照→搜索题库解题为主,llm 作为“good to have”的附加功能,尚处于 Gen-AI 应用的初期阶段,但因为该领域市场空间大,随着 LLM 的智能提升未来仍有较大的发展空间。
而全能型 AI tutor 需要的数据、教研积累多。目前受到模型智能不足的限制,大公司在这个方向占据优势。
如可汗学院推出的 Khanmigo,官方说有 6.5 万名学生正在使用。目前 Khanmingo 能做到根据每个学生的学习进度和需求,提供定制化学习路径和建议;在学生使用 Khanmigo 进行练习时,提供即时反馈,以数理科目为主;提供模拟对话和问题解答的互动学习能力,一步步引导学生思考。
不过根据用户反馈,目前 khanmigo 仅能解决小学低年级阶段的问题,对于较难的问题效果较差。可见依靠 GPT4 level 的智能水平还不能解决数学物理教学问题,难以达到全能的 AI tutor。
02
不同交互的教育类产品介绍
模型能力对教育体验带来的变化、适配的产品形态和代表 case
“模型能力提升、解锁不同应用场景”在教育领域体现相当直观。我们根据教育产品对于互动/实时性、模型推理能力的要求将目前 AI 应用场景划分象限。随着 GPT-4o level 端到端模型实现更好的交互效果、多模态理解、多模态输出能力的发展,以及模型调用成本降低,将会带来更好的教育体验。
GPT-4o level 的交互
GPT-4o 是第一个能实现端到端 voice-in, voice-out 的大模型。这个技术路线是下一代交互的开始:低延迟、高智能。长链路的延迟是用户难以接受的,4o 使得延迟降低,加入了 acknowledge signals 后让用户交互起来更像在与真人交流。这对于互动/实时要求性高的教育场景具有显著意义。典型场景包括 Language AI tutor,Kids reading/curiosity coach。
Speak(进展)
融资:最新融资 2000 万美元(Buckley Ventures 领投,OpenAI startup fund, yc co-founder Paul Graham, LinkedIn CEO Jeff Weiner 跟投),估值翻倍至 5 亿美元。
用户:表示现已在全球拥有超过 1000 万用户,用户基数在过去五年中每年翻倍,覆盖超过 40 个国家。
课程:目前新推出西班牙语课程,后续将推出法语课程。
产品:推出了“AI 畅聊”,用户可以自己创建聊天场景进行英语对话。(体验一般,不如 c.ai 和 GPT-4 store 中的 AI tutor
Praktika
产品:Praktika 使用 GPT-4+Unity Avatars+11labs,创建 voice agent 形式的 AI tutor,提供不同地域口音的 Avatar,模拟真实对话,帮助用户克服语言障碍,提升沟通技巧。
差异:针对有实际英语沟通需求的用户,如职业需求、出国留学等。与竞争对手相比,Praktika 更注重真实对话的模仿,Avatar 是其特点。
Ello
面向儿童的阅读伴侣应用程序,为幼儿园到三年级的孩子设计,帮助孩子培养阅读习惯。
Adaptive Learn™技术:Ello 的 AI 引擎,像一对一的教师一样理解、适应并响应每个孩子的需求。( not llm)
分级读物:提供与孩子阅读水平和兴趣相匹配的电子书籍和纸质书籍。
Sonia
开发了 AI 驱动的认知行为治疗师(CBT),提供语音和文本会话的心理健康治疗服务。为用户提供了成本效益高、可访问性强、随时可用的心理健康治疗解决方案,改善心理健康服务的可及性。
具体应用:
1)AI 治疗师:Sonia 通过手机应用提供完整的治疗会话,用户可以选择语音或文本与 AI 治疗师进行交流。
2)Sonia 提供每年 200 美元的订阅服务,相比传统的每次 200 美元的治疗费用,大大降低了用户的经济负担。
拍搜是上一代教育 AI 中已经验证的场景和需求。在 LLM 之后,尤其随着模型推理能力、多模态能力的提升,拍搜产品也对应进行了升级。多模态理解对于拍照解题场景意义很大,主要区别是从单纯依靠题库变成依靠大模型的知识,可以一步步解答解题步骤。GPT-3.5 到 GPT-4 使得搜拍解题率有大大的提升,GPT-4v 支持多模态后,图形类题目,比如几何题、图表题、物理题都可以做了。
具体来说,凭借目前的模型智能能力:
• 美国中学生解题能做到 85%,之前美国公司只能达到 60%,而中国虽然可以做到 80%,原因是有大量的人力流水线,这海外很难落地,完全不泛化,而且涉及到版权;
• 多模态的图形类题目能解题到 60%(可能是训练的数据量级不够);
• 过去的产品如果用户不懂其中的某个步骤,解答简略的话会卡住,之前只能问真人,现在可以进行追问;
• 卡点是理解能力,可能不是 foundation model 能解的,需要自己做小模型。
在过去半年中,我们观察到有 Answer.ai 这样的创业团队,也有大厂 Gauth、Question.ai 进入到这个领域。
Answer.ai
Answer.ai 是目前在搜拍题目领域代表 Startup。
All in One 学习 App,功能包括解题、概念阐释、记忆和复盘测试为。在 AI 解题中非常注重对于题目中涉及的数学概念的识别和呈现,交互引导比较细致。Answer.AI 目前的月度会员定价是 9.9 美元/月,订阅用户能享受的权益包括无限次数的 AI 交互和 500 次的 Super AI(GPT-4)响应。
用户搜到答案之后,App 会弹出解释知识点、相似问题推送和真人答疑视频推荐三个选项。其中真人解答视频主要来源于 YouTube,用于点击会跳转到 YouTube 观看,相当于将现成公开资源直接整合到产品中,如果学生依旧存疑还可以通过文字/语音继续交互。
Question.ai
作业帮在海外推出的 AI 教育 App,根据点点数据,Question.AI 于 2023 年 5 月 30 日在美国市场上线,之后于 6 月、7 月相继在东南亚和全球其他市场上线。
落地页是 AI ChatBot,用户可以直接输入想让 AI 解答的问题。如果用户需要使用拍照解题功能,可以直接点击聊天框上方的按钮进入拍照页面。另外还有 AI 写作相关功能。
Gauth
字节旗下的 2020 年 12 月就已上线,当时产品名称为 Gauthmath,主推真人 1v1 答疑,后期逐步建立起了数学题库资源,也支持题库搜题。2023 年由 Gauthmath 更名为 Gauth AI,从学科内容上从数学拓展到学科,Gauth AI 主要基于 GPT-4 和 Bard 。产品设计上相对较为简洁,在题目的解释上也相对简略。
模型调用成本下降 90%
很多 AI 教育产品,包括 duolingo max、speak、praktika,全科 ai tutor cheggmate 等,由于 LLM 及 TTS 调用成本过高,导致产品定价过高或使用次数受限,限制了大规模的采用。在未来 1-3 年的时间里,模型的调用成本预计会大幅度降低。这将使得企业能够以更低的价格提供服务。促进认为“good to have“ 但价格太贵的人群的使用。
03
Class Companion类产品
Class Companion 是由 Avery Pan 和 Jack Forbes 为 K12 教师设计的课后作业管理系统,目前专注初高中课程的 written/essay assignments。我们对于 class companion 的核心判断有以下几点:
1. Class Companion 是教师与学生的双赢,是效率和质量的同步提升。教师端减轻了批改作业的负担,提高了工作效率,学生端能获得即时的反馈,根据反馈不断改进,提升了学习体验。
2. 目标市场及商业化路径清晰:class companion 作为面向学区和教师的产品,切 K-12 教育体系的预算,第一步专注付费能力强的美国市场。Class Companion 借助美国学校教师软件购买的权限和主动性,通过让教师试用并推荐产品PLG的方式,自下而上的让学校采购。
3. 创始团队能力全面,满足构建教育 ToB LLM 产品的画像:class companion 面向B端的教师和学区,一方面考验团队对AI的理解,一方面考验团队的销售能力。创始人Avery Pan曾做过老师,也是教育科技公司outschool的全球产品增长负责人,其他团队成员拥有连续创业以及 LLM 产品开发经验。
但对于未来的发展有些 concerns:
4. 从所处的市场空间和产品形态来看,市场空间有限:
a. 学校体系的预算有限,2023 年全球 K-12 教育科技市场体量也仅为 185 亿美元。这其中又牵扯很多教学体系内部自上而下采购因素。
b. Class Companion 解决的场景很小,天花板较低。只有通过扩展产品线,比如从仅仅解决作业反馈场景,延伸到课程学习、课后作业以及课程测验,才有可能扩大产品的想象空间。
5. 竞争维度,虽然目前市场上还未出现其他用LLM辅助的课后作业管理软件,但是传统的教学评估软件有机会增加类似功能,并通过捆绑销售获得价格优势,Chegg 等面向学生的做题工具也有机会推出ToB产品。而目前 class companion 只做了教学的一个环节,容易被功能齐全的进校软件通过增加新组件的方式替代。
教育市场除了我们熟知的面向学生的产品(如语言学习应用Duolingo,课后作业帮手Chegg)之外,还有大量针对教师和学区的进校软件,分类如下:
学习管理系统(LMS):如 Google Classroom 和 Canvas,帮助教师管理课程进度、分发作业、跟踪学生进度,类似企业内的项目管理软件。
学生信息系统(SIS):如 PowerSchool,收集和存储学生数据。
课堂学习软件:如 Classcraft,课堂上使用辅助教学的工具,如通过游戏化激励学生,帮助教师更好地活跃课堂。
作业评估软件:如 Gradescope 和 Albert.io,帮助教师在线创建作业、批改作业,并提供给学生简单的反馈。
进校软件属于 K-12 教育科技费用市场的一部分, K-12 教育科技费用市场包括全球范围内教育机构、政府和私营实体在为K-12学生和教育工作者定制的技术解决方案上的总支出。根据 Market.US 的预测,2023 年该市场体量为 185 亿美元,包括硬件(计算机和交互式白板)、软件(学习管理系统和教育应用程序)服务。该市场相对于面向学生个体辅导的市场较小,预计以25.2%的CAGR增长,到2032年达到1324亿美金。
美国K12课堂信息化程度高,进校软件是一个发展成熟的市场,出现了一批较成功的创业公司。2010年后智能设备开始逐渐走入美国课堂。美国中小学生课堂上人手一部iPad或笔记本电脑,校园WiFi全覆盖,老师在课堂中会同步使用专业化的教育网站,比如 Coggle,Compass Learning,kahoot 等,完成一些课堂互动和小测验。
与 ToC 市场相比,进校软件市场付费方主要是学校和教育机构,产品迭代慢,除了产品效果,还会考虑更换成本、教育体系内的利益关系,很考验团队的销售能力,可以说是“得渠道者得天下”。
目前,将软件销售给学校的公司仍以老牌供应商为主:美国学校管理软件提供商 Frontline Education 成立于1998年,是一家专为K-12学区提供管理和人力资源软件的公司,为12000家教育机构提供服务。新兴公司的机会在于在产品效果上的大幅度创新。Clever 是美国 K12 数字学习平台,成立于2013年,2021 年超过 60% 的美国 K12 学校使用 Clever,包括最大的 100 个学区中的 95 个。Clever 接触大量学生信息,开发数据分析功能,追踪学生的学习进度并产出分析报告,教师和学区管理者通过分析报告可以清楚了解到学生的课程参与情况。
美国中小学分为公立学校和私立学校。公立学校由政府资助并控制,约九成的美国学生在公立学校就读,当地的学区委员会负责教育资金使用。私立学校则基本上不受政府监管,家长和教师联合会对学校的政策制定与执行具有一定影响力,决定资金去向。相对来说,私立学校比公立学校的软件采购更为自下而上,教师主动权更多,预算也更多。
销售教育软件有两条路径,
其一是直接与教育系统的高层合作,其二是通过教师PLG,由教师提出需求让学校采购。
根据 Reddit 用户评论,第一种方式需要建立销售团队,参加贸易展和教育研讨会,将课程赠送给试点学校试用等等。这种方式会花费大量的营销基金,一次宣传可达数十万美元。从业者表示一个教育产品的预算几乎有 1/4 是用来赠送样品和派飞机接见人。过程漫长,这也是为什么大部分教育系统的产品都是几年前的产品。第二种教师 PLG 的方式在美国市场也存在机会,尤其是针对经费更充足、教师主动性更强的私立学校,PLG往往是科技创业公司的选择。
根据一个来自 Reddit 的 K-12 技术软件负责人的讲述,学校内部采购软件的流程是这样的:
• 如果在 "X$"以下(一般为 5000 美元),那就购买软件。
1)如果该公司恰好在该州的采购清单上(类似批准的供应商清单),那么就可以继续订购。
2)如果不在名单上,那么必须进行公开招标,可能中标,也可能不中标。
技术软件负责人表示他不会主动和供应商打交道,除非是老师要求,否则很难引进新产品。
即时沟通在美国教育体系里显得尤为重要。在美国,学生有大量的 essay 作业,这些作业往往是非标的,而每个班级的进度也非常个性化。因此,从布置作业到批改再到反馈,整个过程对老师来说非常繁琐。Class Companion 创始人 Avery Pan 在帮助 Deerfield High School(被誉为“藤校后花园”的顶尖美高)老师,以及作为英语老师的家人的过程中,发现初高中的wrriten essay没有被及时批改,学生得到反馈都在1周之后,甚至永远都不会收到反馈,这影响了学生的学习效果。教师对这个问题很苦恼,但迟迟无法解决。
许多进校软件试图解决教师与学生之间的即时反馈和沟通问题。
Kahoot! 是其中极具代表性的公司。Kahoot!是成立于2012年的在线答题工具,教师可以使用 Kahoot!创建答题游戏,验收学生们的学习情况。Kahoot!因疫情线上化的推动于2021年成功上市,最高峰市值达到 80 亿美元。根据2022年的年报,97%的财富500强企业、全球800多万名教师、数亿学生和个人都在使用Kahoot! 。Whiteboard.fi 为每个学生配备了数字白板,他们可以在上面写字、做标记、添加数学公式,老师实时跟踪学生进度。Albert.io 面向学生定制练习,学生在 albert.io 上完成题目(以数理等固定答案的题目为主)后会获得即时的反馈,帮助理解和纠正错误,面向教育者则提供教学资源、课程计划、学生管理等工具。Gradescope 则是结合人工智能(AI)简化作业的批改评分流程。具体流程是,学生手写作业,以电子文档的形式上传至Gradescope,教师再进行批改。相比 LLM 的直接反馈,学生提交到教师,教师再反馈,操作流程更多,存在时间差,沟通摩擦力还是更高一些。
LLM 的到来,为解锁更为个性化、即时性、互动性的教育场景提供了机会。为老师及课堂设计的LLM产品可以划分为教学前,教学中,教学后。教学前用于课程生成、教学建议;课堂中的促进互动,帮助教师对学生学习状态的实时掌控;课后帮助作业批改,对学生的评估与反馈。
Class Companion 是为 K12 教师设计的课后作业管理系统,专注初高中课程的 写作类作业。教师可以用 Class Companion 创建并布置作业,学生完成后能获得来自LLM的即时反馈和评分,同时教师端能看到作业的结果分析,其中用到LLM能力的模块是即时反馈与评分。2022年12月公司成立,2023年3月份推出产品,目前已经有 10,000 多家美国学校使用。
即时反馈是Class Companion 的核心点,Avery 将这个产品类比为数学课堂上对于计算器的引入。Class companion 是教师的 Copilot,结合了助教、评估软件、家教或作业助手的能力,又实现了课前、课堂、课后学习内容的整合,保证了学习的连贯性。
产品
Class Companion 支持美国的 AP、IB、common care 等主流体系下的初中和高中课程,作业类型以 Written Assignment 为主。
Class Companion 建立了完整的作业流程。老师可以用它创建班级、邀请学生加入、创建作业。
其中创建作业可以使用 AI 生成,class companion 也提供了可以修改作业题目库。
使用 AI 生成后,老师可以持续 prompt AI,不断修改 assignment。
在确定好作业题目后,可以进行更细节的设定,包括属于哪个课程章节、给予 AI feedback 和分数的规则。
教师很喜欢通过 prompt 的方式自定义反馈的功能,通过针对班级和学生个人进行定制,实现因材施教。