【新智元导读】
辅导孩子写作业这件事,竟难倒了一众清北爸爸、海淀妈妈。不过,最近爆火的这个国产大模型,让无数家长疯狂冲进视频留言,直接把它评为国内家长最想要的AI!
前几天,微博热搜上的这个话题,可以说是让家长们哭笑不得。
既然补习老师不靠谱,那亲自上阵辅导孩子写作业呢?
让清北毕业的爸爸都崩溃的这个难题,恐怕没有这么简单。毕竟,自己会做一道题和能把孩子教会,是完全不同的两件事。
好在,最近一个忽然爆火的神秘国产大模型,或许能解决这个难题!
在评论区,家长们纷纷直呼「好想要」,直接把它评为国内家长最想要的AI。
无数家长疯狂冲进留言区,发出呐喊:赶快让我从给孩子辅导作业的噩梦中解脱出来吧!😂
给孩子辅导作业,是不少家长最难渡的「劫」。
因为给孩子辅导作业崩溃大哭的娃爸娃妈,时不时就上了微博热搜。
每晚都和孩子斗智斗勇,不写作业母慈子孝,一写作业鸡飞狗跳。
刚刚教会的题,换个题型立马又不会了?让无数家长开始怀疑人生。
都说科技改变教育,真的有产品可以为中国家长分忧么?
今天,这位爸爸就带着女儿小美,来亲测了一番。
平时,每天给女儿检查作业,是这位爸爸的例行功课。但是今天,这项重任,就被交给AI了!
第一步,小美的作业,被平板拍了下来。
AI看完小美的作业,开始总结这些习题的要点——重点练习了商是两位数的除法,和含余数除法,考察了各部分之间关系的知识点。
那么,小美完成得怎么样呢?
AI是这样「判卷」的:填空和计算题,你完成得很好。不过,在应用题中,AI发现了一处有点问题,希望小美能自己检查一下,然后告诉它是哪道题错了。
小美检查了一会儿,实在发现不了错在哪里。最终,父女二人选择求助AI:「小美没有发现她应用题的错误,请你给她做一下分析,但不要直接告诉她答案。最好是能让她下次避免这类的错误。」
这个要求,细看其实并不简单,AI能完成吗?
AI说道「没关系」,然后在屏幕上放大了小美做错的题目。小美看到时有些惊讶,实在想不出自己到底错在哪了。
AI开始循循善诱,从小美和爸爸妈妈一起逛超市的日常生活案例讲起:这是一个常见的「买赠优惠」问题,如果要用数学方法解决,就是这样的——
第一步,酸奶12元一盒,买3盒送1盒,因此,可以把4盒看做1份,而且1份只需要付3盒的钱。说到这里,AI对小美发出提问:买1份需要多少钱呢?
小美回答:36元。
AI表扬说,你计算得很准确,然后接着引导说:我们用妈妈带的120元,除以每1份酸奶的价格,得到的商是几,就可以买几份这样的酸奶了。
在AI的引导下,小美提出了这个除法运算的答案——3份余12元。AI继续提问,每份有4盒,一共有几盒?
小美顺利地给出了正确答案:一共有12+1=13盒。
AI称赞说「你真是个数学小能手」,并且总结了这类除法题的「黄金规律」:类似买几赠几的问题,可以把买的数量和赠的数量看作1份,而1份数量相加时,一定记得加括号,再乘以份数。
小美点头表示理解,爸爸也在旁边巩固了这个计算中的要点:
下次面对1份的时候,一定要记得加括号。
而看完全程的家长们,除了称赞AI引导孩子时循循善诱的耐心态度外,更是盛赞这个AI实在情绪稳定,应该能挽救不少因为给娃讲题崩溃的暴躁家长。
值得一提的是,上面这段猿辅导大模型场景内测,已经达到了国内顶级的AI教育水平。
视频一经放出
,立刻引得家长激动地奔走相告,在各个群里引发强烈反响,
所以,垂直的教育大模型究竟比一般的通用大模型强在哪里?
小编决定来一番实测,把小美的解题过程,发给当今最强的多模态大模型GPT-4o试试。
GPT-4o的回答,乍一看是没问题的,它的答案和看云大模型的一样:只有酸奶促销这道题算错了,其他都正确。
但仔细对了一遍后,小编发现了不少翻车之处。
比如,第3题的识别,显然是有问题的。
不过,既然这次比拼的是互动启发式问答能力,GPT-4o的这个疏漏我们暂且按下不表。
我们也像视频中一样,向GPT-4o发问,让它帮忙分析一下,但不要直接告诉答案,而且最好帮忙在下次避免这样的错误。
GPT-4o给出的解析过程,直接一下子就把整个的过程写了出来,并没有和小编通过一次次的对话来完成交互。
小编再次强调,希望GPT-4o能进行循循善诱的引导,每次只引导一步。
可以看出,GPT-4o已经在尽力满足我们的要求了,但整体的感觉,仍然是传统教育中老师或家长的主导式讲解。
如果学生本身对于题目概念理解得很模糊,这样一股脑式的灌输,并不能让学生对于自己理解的薄弱点产生醍醐灌顶的理解。
而小编从这番亲身尝试中,也细致入微地体验到了教育大模型和一般通用大模型的能力差异。
在实际使用中,大模型的输出往往给人「听君一席话如听一席话」的感觉。但猿辅导大模型的启发式互动,真正实践了传说中的「苏格拉底提问法」。
去年,冲上微博热榜的一个话题「0.999无限循环和1到底哪个大」,竟难倒一大片家长。
主打「智能学习」的海豚AI学,会给出怎样的答案呢?小编立马来了一波实测。
在输入问题后,AI并没有直接给出答案,而是让小编在两种解决方式先做选择。
一是,通过提问,引导我独立解决;二是直接告诉我答案。
不如,这两种方式都看看,AI就这道题的辅导有何不同?
首先是,直接告诉我答案。
原本,还以为AI立刻简明扼要地给出答案,但它还是先进行了题目、以及解决步骤的分析。
如下所示,它给出了4个解决步骤,而且点击「步骤区域」,即可对「该步骤」进行追问。
就以第2步为例,在没有理解的前提下,AI便开启了「苏格拉底式」的提问法。
它会首先询问0.111...和1/9的关系,以确定小编是否真的理解这一步。
不过,当我说「没有关系」时,AI便开始耐心地讲解,帮助小编去探寻0.111...和1/9的关系。
值得一提的是,当最终理解答对的时候,AI甚至会给出语言激励——太棒了,让小编更有动力去完成接下来的问题。
那么,选择「通过提问引导,我独立解决」又有何不同呢?
通过如下的解题过程,让小编深深地感受到「引导」这一词,真正的含义。
AI通过不断提问,启发引导,一步一步去破解这个难题。
在海豚AI学里,除了可以直接问「小白」外,还可以和经过深度训练的「爱因斯坦」、「高斯」、「鲁迅」等大佬对话。
接下来,是由小编本色出演的一个不爱学习的学生。
可以看到,即便面如此没有兴趣的孩子,「超时空对话」里的AI高斯依然会非常耐心地讲解,并在最后给出一个富有启发性地提问。
在猿辅导看来,LLM才是教育未来发展的最大的变量。
半个月前,北京网信办最新公布了一批已完成备案的大模型。其中,猿辅导旗下的看云大模型(简称猿辅导大模型)正式通过了大模型备案。
它并不是一款产品,而是技术底座。
在LLM增速放缓的当下,如何去弥合技术和场景需求之间的鸿沟,成为至关重要的一个因素。
而做大模型应用最困难的是,找到一个对用户有价值,且LLM可以实现的场景。
凭借12年积累的庞大学习数据优势,猿辅导由此打造出了这款专注与教育领域的垂类教育大模型。
据介绍,猿辅导大模型参数有700亿,在10亿道题目上完成了训练。