作者:李宇明
来源:语言资源高精尖创新中心
【沙龙导读】本文是李宇明教授在“一带一路”语言资源与智能国际学术研讨会上所作的主旨报告。他在报告中指出,随着语言智能的快速发展,人类正在迎接与机器人共事的时代,机器人将逐步进入到一些生活领域和生产行业。他根据“语言交际的难度”对机器人能够进入行业的顺序进行了预测,并指出此预测的意义:既能指导领域语言智能研究的开展,又会向社会传递一种“新生劳动力”信息,促使人们思考并积极迎接今后的生活生产方式。
非常感谢主席对我的介绍。首先,我以语言资源高精尖创新中心主任的名义,热烈欢迎国内外来宾出席本次会议,共论语言资源、语言智能的学术前景。
我在大会《寄语》中写道:“人类语言生活正面临两件大事:第一,人类语言正大面积濒危,不少语言面临消亡;第二,随着人工智能的快速发展,具有语言智能的机器人正在更多参与人类的生产与生活。如何保护人类的语言资源,如何迎接人与机器人共处的时代,有技术问题,也有社会伦理问题,需要全世界的学者关注、行动与合作。”本次会议就是为了解决这两个问题而召开的。我今天的报告,是针对第二个问题发表一些看法:迎接人与机器人共处的时代。
随着语言智能的快速发展,一个新的时代正在快步走来,这就是机器人作为人类的助手和朋友、与人类一起生活、一起生产的时代。目前,机器人的主要工作领域,是在人类不能到达、或不便到达的一些特殊岗位,如探险、救灾、高空无人监测等。近来,随着人工智能、特别是语言智能的发展,机器人具有了一些与人类交流的语言能力,逐渐进入到一些生活领域和生产行业。常被提及的有机器翻译、机器新闻写作、机器作诗、儿童社交机器人、商贸后台服务等。例如:
在机器翻译方面, Google的免费翻译服务,可提供中文与100 多种语言之间的互译。百度可支持中、英、日、韩、泰、法、西、德等28种语言的互译,具有756个翻译方向。2017年6月30日在天津召开的首届世界智能大会上,科大讯飞董事长刘庆峰做了“智能改变社会生活”的主题演讲,他指出:机器口语翻译已经达到大学6级的水平,不出意外2年后可以达到专业8级水平。
在新闻写作机器人方面,有新华社的“快笔小新”、 第一财经的“DT稿王”、《南方都市报》的“小南”、今日头条的“张小明”、腾讯财经的Dreamwriter等,美联社、《纽约时报》《华盛顿邮报》《洛杉矶时报》等国外新闻机构应用机器人写稿的消息,也频频见于媒体报道。
在机器作诗方面,2017年3月20日,清华大学语音与语言实验中心(CSLT)网站宣布,他们的作诗机器人“薇薇”通过了社科院等唐诗专家评定和“图灵测试”。“薇薇”创作的古诗词,有31%被认为是人创作的,但总体上水平尚低于人类。另据网易智能2017年5月19日的消息,微软机器人小冰出版了诗集《阳光失了玻璃窗》,这本诗集收录139首现代诗,是从它创作的70928首中精选出来的。
据环球科技综合报道,2017年7月5日,在百度人工智能开发者大会上,ARMOTO儿童社交机器人亮相。ARMOTO是瑞典设计的,与百度DuerOS进行战略合作后功能大增,不仅可以为孩子播讲故事,播放歌曲,同时作为孩子的智能小助手,可以语音互动,回答十万个为什么,还实现中英翻译的功能;可以通过语音命令机器人进行变身、变色,发射空气炮等机械运动。
商贸后台客服已是常见现象。有一次,我家用手机买了某超市的一些日用商品,优惠信息里说购物达到一定金额就可以打折,但手机付款后并没有打折。家人用微信与客服联系,几个话轮下来,觉得客服说话没诚意,应付人,就写了两个字“陷阱!”。客服回话说:“亲,很抱歉哦,小多还没有学会这个问题哦,你动动手指转人工姐姐为您处理吧。”原来是机器人“美多多”在执勤。
1969年7月20日,阿波罗登月飞船的指令长阿姆斯特朗,在踏上月球表面的那一刻说:That’s one small step for a man, one giant leap for mankind.(个人一小步,人类一大步。)借用阿姆斯特朗这句名言,我们现在可以说,语言智能一小步,人类社会一大步。前面所举的语言智能的例子,虽然只是一点点小进步,但却会对人类社会起到巨大的推进作用。我们应做好迎接人与机器人共处的新时代的准备。
这一时代到来之快慢,机器人在哪些行业发挥哪些作用,主要取决于两个方面的因素:其一,社会对机器人的需求;其二,机器人技术的发展。社会需求决定着研发资金的走向和研发力量的聚向,一般来说,军事、国家安全、高危行业、经济利润显著的领域等,具有社会优先性。机器人技术可分为两大部分:机器人一般技术和语言智能。机器人进入人类社会的速度与路线,不仅取决于一般技术的发展,更取决于语言智能的发展。
语言信息处理已经有几十年的历史,今天的语言智能是历史发展的成果。以往的语言信息处理主要关注的是书面语问题,是那些较为正规的语言交际,而很少考虑语言生活中带有各种噪音背景、带有各种特色的话语。而如果机器人要做人类的助手和朋友,最重要最急迫须解决的可能就是对这类口语的理解问题。而口语的研究、口语数据库的建立、口语资料的搜集又是当今语言学的短板,亦是计算机语言处理的短板。如果说大数据的语言资源(和新算法)是语言智能发展的基础,那么建设新的语言资源是实现人与机器人共处的基础性工作。
机器人进入生活、生产领域,可称之为机器人的“入世”。机器人不可能一下子就进入人类的所有活动领域,而会有一个先后顺序。机器人的入世顺序,可虚拟为:
-
博物馆、展览会等的讲解员;
-
导医、导购、指路等导引行业岗位;
-
商贸等的后台客服;
-
咨询活动,高级的咨询活动是经济咨询、法律咨询、学术咨询等;
-
陪聊、陪玩等娱乐伴侣;
-
一般翻译工作;
-
秘书、记者等助手,做一些简单写作和数据整理等工作;
-
家政、医护及老年人、儿童、家庭宠物等照看工作;
-
学习的帮助者,由机器人家教发展到机器人教师等;
-
其他。
1~10的排序,主要根据的是“语言交际难度”。如何定义“语言交际难度”,还是一个新课题。上面顺序所蕴含的“语言交际难度”的标准是:a)独白与对话的比例,对话多,则语言交际难度大;b)对话人、对话环境的复杂度;c)对话质量要求的高低;d)对话内容的难度;e)对话的社会意义的重大程度。
上述语言交际难度的定义是否合理,以及如何具体测量语言交际难度,都还是需要研究的问题,此处不妨将a)-e)作为假说看。但有一点认识是重要的,就是:语言交际难度及人工智能如何解决语言交际难度,决定着机器人的“入世顺序”。故而1~10的虚拟顺序,在机器人未来的实际发展中会有变化,也许还要区分每个领域的应用层次,比如写作、翻译都可以区分初级、中级、高级等。