“应该给孩子买什么样的书?”不光是在中国,这个问题也困扰着其它很多国家的家长。
在美国,这个问题已经有了成熟的解决方案:通过对阅读内容和孩子阅读水平的评测,帮助他们找到符合自己阅读难度的图书。而相比之下,国内少儿书籍的大部分测评都来自出版社,“适合 X 岁儿童阅读的读物”成了万能用语。
看到了差距和已经被验证可行的模式,从哥大毕业的赵梓淳转身回国投入创业大潮,成立考拉阅读:要利用 AI 技术根据学生个体能力推荐适合阅读的书目,打造中国学生的个人图书馆。
本文授权转载自| 铅笔道(ID:pencilnews)
老师站在讲台上,自顾自讲述鲁迅文章背后的思想、文中所用的手法等,而学生则一脸茫然。这是赵梓淳记忆中的语文课堂。
2014 年的一天,哥大在读的赵梓淳受朋友所邀,体验了一节分级教材授课。孩子们使用不同难度的教材,学习同样的内容,积极活跃,与国内截然不同。“读得懂才有助于培养孩子兴趣。”
今年 6 月,赵梓淳参照美国分级标准,创办考拉阅读,为国内孩子解决阅读难题。考拉阅读尝试用 AI 技术打造中文阅读分级标准,系统自行评判文本难易程度,从而为学生推荐与其水平相当的书籍。
在培养学生阅读兴趣和能力的同时,它还通过线上读后测验的形式,为学校提供学生阅读时长、表现等全方位数据反馈。
两个月后,赵梓淳拿到了真格基金和 PreAngel 的 400 万元种子轮投资。
不科学的阅读推荐
2014 年,赵梓淳尚在哥大读书。这天,他被朋友拉入一间教室,课堂上,老师正在使用蓝思分级教材授课。
同样的内容采用不同的语言表达方式,形成不同的阅读难度,比如全文词汇数量、高频词汇数量及比例、是否存在长难句等,孩子们可选择适合自己阅读能力的难度,这样“所有孩子都能读懂内容”。那一刻,赵梓淳被“震撼”了。
他联想自己当年在国内接受的语文教育,只觉天壤之别。国内阅读教学相对粗放,老师会讲鲁迅文章背后的思想、运用的手法等,“却并不在意学生是否听得懂、看得懂,是否觉得枯燥”。久而久之,学生容易丧失阅读兴趣。
孩子不同于成年人,不具备对书籍的筛选和理解能力。他们接触到的书籍有限,而这些书籍能否引发阅读兴趣,取决于书籍难易程度与孩子阅读能力的匹配。“太难的书孩子读不下去,太简单的对进步无益。”
而国内传统的阅读推荐模式不外乎两种,在赵梓淳看来都不够科学。一种根据年级推荐,一年级的课外读物是什么,家长就给孩子读什么。“给孩子买鞋时,家长会说买一双一年级的鞋吗?”赵梓淳指出,这应按照脚的大小来定,阅读能力也是如此。
另一种则根据优等生推荐,学习好的孩子读什么书,家长就给孩子买这本书。在两个孩子阅读能力不一致的情况下,很难起到效果。
与此同时,美国的 AZ 分级、蓝思分级等,已在市场上得到普遍验证,各类相关公司层出不穷。赵梓淳隐约摸见方向,但出于中美语言本质的不同,他陆续寻觅语言学领域专家,以期增加了解。
孩子的个人图书馆
去年 10 月,赵梓淳归国后即投入创业大潮。但这时,他并未启动分级阅读项目,而是创办了一个留学相关的内容平台。“分级阅读跟教育相关,还是挺大的一件事,不太好操作,时机也不够成熟。”
尽管已积累六万多用户,但留学平台始终未寻到合适的商业模式,赵梓淳撑着公司只觉无从下手。今年 6 月,与另一位合伙人的一次聊天促使他作出决定,“趁账面上还有钱,把留学平台关掉”,创办享阅教育科技有限公司,启动分级阅读项目——考拉阅读。
这时,他得到的不仅是合伙人与团队的支持,还有近一年拓展的学界资源。考拉阅读背后的教授顾问团包括北京师范大学和清华大学文学院的心理学、语言学学者。而提供 AI 技术与工程搭建的则是来自于北大的数据科学家团队和工程师。
项目启动后,调研持续了两个多月。赵梓淳从校长和语文老师一方,获得了更多和数据相关的需求反馈。在分级阅读之外,老师希望得知学生的阅读进度和效果,校长也需要学校学生平均阅读时长与表现、不同班级阅读时长等全方位数据。
至此,他设计出产品初步形态:利用 AI 技术根据学生个体能力推荐适合阅读的书目,打造学生的个人图书馆。
产品通过测试获知学生的阅读能力,推荐与其水平相当的书籍。学生阅读后,完成相应测试,考察书籍理解度与能力增长曲线。此外,学校可同步查看学生的阅读进度以及测试结果。
打造中文分级阅读标准
由于中文语言体系与英语语言体系的区别很大,因此,虽然分级的最初理念相同,但是打造一款适应中文特点的本土化阅读分级体系是具有一定难度的,这也使得专家和专业的技术团队显得尤为重要。目前,团队已配备了曾在 IBM中国研发中心 Waston for Life Service 智慧医疗平台和搜狐大数据中心从业过的 CTO 任易带领的技术团队以及清华大学语言学研究中心主任黄国营带领的语言学研究团队,主攻算法模型方面。除此之外,该项目还已经与北京大学机器学习实验室和纽约大学 Courant 研究院 CILVR Lab 实验室进行了合作,共同研发 ER Framework (享阅中文分级标准)。
考拉阅读分级的维度,不再是以长难句和词频为主,而是结合中文特点,从对由小到大的中文语义单位的特性分析入手。相对于蓝思分级,考拉阅读会采用更多的标准构建模型,将语言学领域的知识通过 AI 系统进行拟合。但由于中文文字的数量之广,含义和用法之多,语料库始终需要不断的完善和深耕。这一方面也将是产品未来将着重努力的一个方向。
因用户定位为学生群体,此外兼顾学校阅读监测需求,故考拉阅读将主要针对 B 端(学校)销售,收取一定的软件授权费以及年服务费用。
1.0 版将纳入 6000 本课外读物,学校购买后,学生即可免费阅读。考虑到线上版权以及儿童过量使用电子产品的问题,赵梓淳或采用线下阅读+线上测试的模式操作,但他也提到,“如果跟京东阅读谈妥版权,就可实现线上阅读”。
近期,他计划进一步完善标准与产品,提高市场占有率,以阅读领域为切入点,未来将打造全平台的自适应阅读、学习系统。“当标准打造成熟,甚至可以授权给出版社作为选书标准。”