本文介绍了科大讯飞在人工智能领域的发展,包括多语种实时翻译技术、个性化语音合成技术、汽车智能车载系统等方面的应用。文章指出,人工智能落地的入口是语音交互,科大讯飞把握住了这个入口,以专注的态度深耕语音交互技术,在人工智能实用化方面取得了显著进展。文章还提到,人工智能是未来发展的必然趋势,但更需要切实有效的落地方式,尤其是在人机交互方面,给各行业以及消费者带来变化的机会。
人工智能是未来发展的必然趋势,需要切实有效的落地方式,尤其是在人机交互方面,给各行业以及消费者带来变化的机会。
今天,人工智能的未来方向已经成为技术化公司的标配,都在向人工智能、深度学习的未来发力。
瞄准未来没错,但对于企业而言,如何让人工智能更有效地落地,这仍是一个重大课题,而且也是各行各业的技术升级都有价值之处。
11月23日,在人工智能学科诞生60周年之际,科大讯飞全球首发了多语种实时翻译技术,能够实时将中文翻译成英语、日语、韩语、维吾尔语等,并推出了个性化语音合成技术通过打造个性化音库,使用户随时随地用最喜欢的声音来朗读文字。
另外,科大讯飞还推出汽车智能车载系统——飞鱼助理,实现在车载环境下通过语音实现全程控制,并介绍了人工智能技术在教育、家居、机器人等领域的系列应用。
无论是中文翻译、个性语音库还是飞鱼助理,这其中的核心点其实只有一个,那就是用人工智能实现语音转换文字的应用。我认为,这正是人工智能落地的入口。
如科大讯飞董事长刘庆峰在演讲中所说,未来5到10年,人工智能会像水和电一样成为我们生活的必需品,深刻改变我们的世界。的确如此,但是,人工智能是非常大而广的概念,让人工智能更效地落地,更需要切实有效的入口。这个入口显然不是离我们还比较远的无人车,也不是正在进步发展中的机器人,而是切切实实能给各行业以及消费者带来变化的人机交互。
举个最身边的例子,曾经有人撰文称,在微信上发语音的人,是不尊重对方,因为对方当时也许在开会无法听语音,而且语音也涉嫌“听不清楚”,不如文字来得直接。
没错,这一观点有道理,但却也缺少一个考虑维度,那就是发微信语音的人当时在路上,无法一个字一个字输入。如果这时有语音转换文字,是不是双方都皆大欢喜了?
微信语音这个事,只是一个最简单的例子,事实上,基于语音的人工智能入口,正是从消费者到各行各业的普遍刚需。
去年,科大讯飞推出的讯飞听见产品,实时将语音转写成文字,速度和准确率远超人工速记,现场识别正确率达到99%以上。昨天的发布会上,讯飞听见进行实时语音转写,并以字幕形式呈现,再次将这一刚需产品进行了推广。
另外,讯飞听见在实时中文语音转写的基础上,融合全新的多语种翻译技术,实时将中文演讲翻译成英语、日语、韩语,维吾尔语并同步展示在大屏幕上,引发现场的一个高潮,这也是全球首次基于人工智能技术的实时机器多语种翻译技术在大型活动上的展示,准确率比肩同传翻译。
发布会上,科大讯飞同时发布了几款产品,如在智能家居方面,科大讯飞以超脑魔盒为入口,打造了一个通过语音便捷控制家居设备的智能环境。超脑魔盒集合了科大讯飞语音识别、自然语言理解等核心技术,包含全网影音、智能家居、遥控器K歌、英语翻译学习、生活百科问询等五大功能,并且包括切换、快进等设置全程语音操控,0.2秒的语音搜索速度,老人小孩都能轻松上手,由此开启更智能、更有趣的智能家庭互动体验。
而在汽车领域,飞鱼助理可以将远场识别、全双工、多轮交互、方言识别等技术应用于汽车,通过接入多种内容渠道,飞鱼助理可以在复杂的行车环境中轻松进行通讯、导航操作,收听了解多媒体娱乐信息,对车身进行控制和信息查询等服务,使用户在驾驶中无需分心。目前,科大讯飞已与30多个汽车厂商建立了长期合作,并已在100多款量产车型中搭载产品。
所以,我们不难看出的是,科大讯飞的远景是人工智能,并且也提出了“讯飞超脑”计划,直接对谷歌大脑和百度大脑发起挑战。但更可以明确的是,科大讯飞在发展人工智能远景的同时,把握住了人工智能的落地入口,这就是语音交互,这是比无人车、机器人更能呈现人工智能的刚需入口。