智能音箱是伴随着互联网云端大数据处理、语音识别和语义理解相关算法、人工智能训练学习算法以及硬件相关的语音降噪、回声消除、音源定位等相关生态技术逐步成熟的产物,与传统音箱相比,其核心功能已不再仅限于音乐播放,由于增加了语音交互和智能学习功能,被赋予了更重要的任务:物联网入口。
智能音箱最初的应用虽然比较简单,譬如:播放互联网音乐、语音搜索回答问题、阅读新闻、为运动评分、控制灯光等等,但由于其平台接口的开放性和智能学习性,应用功能在快速的增加增强,譬如例如,Alexa为Echo提供的语音服务功能一开始只有几十种,经过不到两年的发展,如今已经提升到了近五千种,可以想象其未来的发展空间。
智能音箱在国外较早布局的是Amazon Echo和Google Home,并且引导了行业潮流,也促使国内相关生态企业加大了在该领域的投入。
国内相关生态如下:
阿里、京东、小米等互联网电商企业;
腾讯、百度、网易等互联网大数据、云计算相关企业;
思必驰、科大讯飞、云知声等语音算法处理及整体方案提供商;
科胜讯、瑞芯微、晶晨、全志、联发科等主处理器提供商;
芯唐、德州仪器、科胜讯、顺芯、苏州敏芯微等前端硬件提供商;
TCL通力、三诺、歌尔等代工厂商
一,当前主流产品方案简介
(1)Amazon方案
Mic
:
7pcs,Analog ,Bottom type 6+1
SNR/AOP:65dB/124dBSPL
ADC
:
4pcs,2ch I2S TLV320ADC3101
主处理器:
TI
,单核
A8DM3725
语音算法:
AmazonAlexa
(包含
Amazonpolly
和
lex)
(2)Google方案
Mic
:
2pcs
Digital PDM bottom type
协处理器:
Atmel,ATSAMD21
主处理器:
Marvell
,双核
A788DE3006
语音算法:
Google DeepMind
(3)Dingdong一代方案
Mic(一代)
:
8pcs,Analog ECM type 7+1
Mic(二代)
:
6pcs,Analog 敏芯MEMS硅麦
ADC
:
4ch I2S CX20810
主处理器:全志,四核
A7R16
语音算法:科大讯飞
二、语音算法处理及整体方案商
(1)苏州思必驰信息科技有限公司
思必驰自2007年成⽴至今,先后获得联想、启迪等知名VC投资,总部位于苏州,在北京、深圳设⽴立分公司,与上海交⼤大建⽴立了智能⼈人机交互实验室。方案特点:具有双mic、四mic、环形6mic或6+1mic方案
1、精准声源定位,5米距离识别率高达92%;
2、支持即时打断,支持离线识别和本地指令,可定制场景;
3、提供硬件整体解决方案和云端第三方合作内容
;
(2)科大讯飞股份有限公司
成立于1999年,科大讯飞股份有限公司是一家专业从事智能语音及语言技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成的国家级骨干软件企业。
麦克风阵列产品对比
三、音频硬件方案商
(1)瑞芯微电子股份有限公司
瑞芯微于2016年CES上发布了RK3229,是一款集成有ARMMali-400MP2
GPU的四核A7芯片,支持10/100兆以太网、HDMI2.0,能播放10
bit、H.265编码的4K视频。音频采集具有4chI2S,支持6mic+2AEC或7mic+1AEC,可直接采用I2S类型的数字mic,不需外挂ADC和多路信号整合IC。
(2)珠海全志科技股份有限公司
全志科技在智能音箱领域参与较早,京东与科大讯飞合资成立的灵隆科技所开发的Dingdong音箱即是采用其四核A7芯片R16,之后迅速在行业内得到推广,方案架构如下图。2017年预计全志将推出内置TDM音频接口的双核A7芯片G102,其他资源也进一步会得到优化。