利用深度学习做语音交互的开发者,很可能对
两个谷歌的产品
特别关心:
-
五月初,谷歌 AIY 项目(“Artificial Intelligence Yourself”)的首款产品——
Voice Kit 面世。
Voice Kit 套件可借助 Google Assistant SDK 和 Cloud Speech API,将树莓派3 转换为语音数字助理。用户可在此基础上创建虚拟语音助手、为自己的项目添加语音交互功能。当时,在全球开售的几小时内,Voice Kit 就被抢光——这对谷歌而言是一个很强烈的信号。AI 社区对 DIY 人工智能开发套件的需求存在,并且特别强烈。
-
上周,谷歌 AIY 和 TensorFlow 团队开源了语音命令数据集。该数据集包含数千个志愿者对 30 个命令短语 65000 次长约一秒钟的发音。开发者可借此创建最基础的语音交互应用。
今日,好消息来了。AI 科技评论获知:
谷歌将把两者结合,下个版本的 Voice Kit 会内置语音命令数据集。
用新版的 Voice Kit,开发者可直接搭建能用简单语音命令交互的 DIY 设备,不需要设置以某个按钮开启语音交互功能,也不需要联网。
新版 Voice Kit 今日在美国
开启预订
。开发者也可在线下门店,以及线上 Micro Center 购买。谷歌表示,年底将向全球市场开放购买。
如果等不及,你可能就不得不自己动手了。一名叫 Shivasiddarth 的开发者,就在 hackster 创建了
“ Make Your Own Google Voice HAT ”
(“制作你自己的谷歌 Voice HAT”)项目,指点大家如何自己动手。
谷歌表示,AIY 项目的最终目的,是“让开发者进行实验,制作能理解人类语音、视觉和动作的设备”。
雷锋网还得到消息,下一步,谷歌将推出能与 Voice Kit 配套的视觉、动作检测工具。AIY 项目将会向大家提供具备“眼睛”“耳朵”“嗓音”“平衡”功能的开发套件,创造简单但强大的人机交互。
三个有意思的 DIY 案例
受老式对讲机的启发,Martin Mander 用 Voice Kit 搞出了这么个玩意儿:
他称之为 “
1986 Google Pi 对讲机
”。这是一个“挂在墙上的谷歌语音助理”,硬件包含树莓派3、谷歌 AIY 的 Voice Kit,以及他用 4 英镑买的一部 1980 年代中期的对讲机。
英剧《神秘博士》的粉丝可能会喜欢这个:Tom Minnich 搞了个 Dalek 嗓音的语音助理。
当他问:“生命的意义是什么?”
“Dalek”回答道:“我有生产商的质保,所以用不着考虑这种问题。”
Victor Van Hee 用 Voice Kit 开发了一套语音控制的
网络直播收音机
,也能播放其它音频文件。