专栏名称: 程序员大咖
为程序员提供最优质的博文、最精彩的讨论、最实用的开发资源;提供最新最全的编程学习资料:PHP、Objective-C、Java、Swift、C/C++函数库、.NET Framework类库、J2SE API等等。并不定期奉送各种福利。
目录
相关文章推荐
码农翻身  ·  程序员家长装备了一件秘密武器! ·  昨天  
OSC开源社区  ·  CentOS Stream 10正式GA ·  2 天前  
程序员小灰  ·  利用AI编程,小灰做了一个五子棋游戏 ·  2 天前  
程序员小灰  ·  全网第二名! ·  4 天前  
程序员的那些事  ·  被阿里合伙人疯狂PUA的灵犀互娱团队,原来是 ... ·  5 天前  
51好读  ›  专栏  ›  程序员大咖

书白读了!机器人挑战北京高考数学卷,考了105分

程序员大咖  · 公众号  · 程序员  · 2017-06-09 19:05

正文

6月7日,成都高新造人工智能系统“准星数学高考机器人”AI-MATHS对2017高考数学科目发起了挑战,在22分钟的时间里,得分105分。整个过程是严格按照断网、断库、自然语言理解、综合复杂推理等严格流程进行的公开透明测试。


据介绍,AI-MATHS是成都高新区一家本土人工智能企业—一成都准星云学科技有限公司,依托清华大学大数据、人工智能、自然语言识别等前沿技术,研发的一款以自动解题技术为核心的人工智能系统。

  图为机器人所做的答卷。


在成都高新区天府新谷10栋9层的一个封闭空间里,一位特殊“考生”准备挑战今年全国高考的数学。它就是成都高新区一家企业研制的高考机器人,名叫“AI-MATHS”。



图为封闭在房间里的准星数学高考机器人。


“AI-MATHS”考试的房间门外贴有“所有设备断网断库”的标识。所谓断网断库意味着,模仿考生封闭环境的闭卷考试;测试复杂逻辑推理能力与联想能力;断绝一切可能的外界支持,包括专家系统库。这也是人工智能技术的核心——断网断库场景下的综合逻辑推理能力。



图为挑战现场

从下午18时28分到19时29分,“AI-MATHS”分别挑战了北京卷文科数学以及全国二卷文科数学的考试,分别用时22分钟和10分钟,得分为105分和100分。尽管和之前预期的110分目标还有差距,但是作为“家长”——成都准星云学科技有限公司CEO、清华大学苏州研究院大数据中心主任林辉介绍,“前几个月的书,这孩子没白读。”


两次考试具体得分如下:北京文科数学卷,选择题满分、填空题20分、解答题45分,全卷105分;全国卷二选择题55分、填空题20分,解答题25,全卷100分。在选择题和填空题上,“AI-MATHS”表现十分亮眼。丢分环节主要是解答题,有些题目甚至是0分。



图为录题区。


研发高考机器人最大的难点在于,要让系统准确理解人类语言。“AI-MATHS”之父林辉称:“直接用数学语言表述的应用题它可以轻松解答,但它最大的弱项是不能理解考题里场景式的描述语言,它会读不懂题目。”


图为机器人答题现场。


林辉打了个比方,如果题目是10-1=?人工智能系统可以轻松作答。但如果题目用了场景描写将其表述为“小明有10个苹果,小丽吃了一个,请问还有几个苹果?”面对这样的情况,人工智能系统就“傻”了,“它不理解小明是什么、小丽是什么、吃又是什么意思。”


图为机器人答题现场。


评阅试卷的老师分析,在评卷过程中,“AI-MATHS”所犯错误的题目都有一个共同点:语言文字太多。这表示,高考机器人在自然语言上的理解稍稍欠缺。相反,在理解数学语言上相对容易。



图为老师判卷现场。


教师祁祖海认为,一般学生的成绩大约在110分左右,而这次“AI-MATHS”取得的分数,大概处于本班学生的中等水平。但是他坦言,高考机器人的进步空间会很大。



图为机器人答题现场。


【版权归作者所有,程序员大咖整理发布】


  • 参考:综合自:中新网、新华网等

  • 转载请联系作者获得授权。

↙点击“阅读原文”,加入 

『程序员共读』