智能音箱是伴随着互联网云端大数据处理、语音识别和语义理解相关算法、人工智能训练学习算法以及硬件相关的语音降噪、回声消除、音源定位等相关生态技术逐步成熟的产物,与传统音箱相比,其核心功能已不再仅限于音乐播放,由于增加了语音交互和智能学习功能,被赋予了更重要的任务:物联网入口。
智能音箱最初的应用虽然比较简单,譬如:播放互联网音乐、语音搜索回答问题、阅读新闻、为运动评分、控制灯光等等,但由于其平台接口的开放性和智能学习性,应用功能在快速的增加增强,譬如例如,Alexa为Echo提供的语音服务功能一开始只有几十种,经过不到两年的发展,如今已经提升到了近五千种,可以想象其未来的发展空间。
智能音箱在国外较早布局的是Amazon Echo和Google Home,并且引导了行业潮流,也促使国内相关生态企业加大了在该领域的投入。
国内相关生态如下:
阿里、京东、小米等互联网电商企业;
腾讯、百度、网易等互联网大数据、云计算相关企业;
思必驰、科大讯飞、云知声等语音算法处理及整体方案提供商;
科胜讯、瑞芯微、晶晨、全志、联发科等主处理器提供商;
芯唐、德州仪器、科胜讯、顺芯、苏州敏芯微等前端硬件提供商;
TCL通力、三诺、歌尔等代工厂商
一,当前主流产品方案简介
(1)Amazon方案
Mic:7pcs,Analog ,Bottom type 6+1
SNR/AOP:65dB/124dBSPL
ADC:4pcs,2ch I2S TLV320ADC3101
主处理器:TI,单核A8DM3725
语音算法:AmazonAlexa(包含Amazonpolly和lex)
(2)Google方案
Mic:2pcs
Digital PDM bottom type
协处理器:Atmel,ATSAMD21
主处理器:Marvell,双核A788DE3006
语音算法:Google DeepMind
(3)Dingdong一代方案
Mic(一代):8pcs,Analog ECM type 7+1
Mic(二代):6pcs,Analog 敏芯MEMS硅麦
ADC:4ch I2S CX20810
主处理器:全志,四核A7R16
语音算法:科大讯飞
二、语音算法处理及整体方案商
(1)苏州思必驰信息科技有限公司
思必驰自2007年成⽴至今,先后获得联想、启迪等知名VC投资,总部位于苏州,在北京、深圳设⽴立分公司,与上海交⼤大建⽴立了智能⼈人机交互实验室。方案特点:具有双mic、四mic、环形6mic或6+1mic方案
1、精准声源定位,5米距离识别率高达92%;
2、支持即时打断,支持离线识别和本地指令,可定制场景;
3、提供硬件整体解决方案和云端第三方合作内容;
(2)科大讯飞股份有限公司
成立于1999年,科大讯飞股份有限公司是一家专业从事智能语音及语言技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成的国家级骨干软件企业。
麦克风阵列产品对比
三、音频硬件方案商
(1)瑞芯微电子股份有限公司
瑞芯微于2016年CES上发布了RK3229,是一款集成有ARMMali-400MP2
GPU的四核A7芯片,支持10/100兆以太网、HDMI2.0,能播放10
bit、H.265编码的4K视频。音频采集具有4chI2S,支持6mic+2AEC或7mic+1AEC,可直接采用I2S类型的数字mic,不需外挂ADC和多路信号整合IC。
(2)珠海全志科技股份有限公司
全志科技在智能音箱领域参与较早,京东与科大讯飞合资成立的灵隆科技所开发的Dingdong音箱即是采用其四核A7芯片R16,之后迅速在行业内得到推广,方案架构如下图。2017年预计全志将推出内置TDM音频接口的双核A7芯片G102,其他资源也进一步会得到优化。
(3)晶晨半导体(上海)股份有限公司
晶晨半导体在智能家居领域将推出两款产品,目前尚无详细资料。
A112:支持8ch I2S输入;
A113:支持8chI2S和8ch PDM输入
(4)科胜讯系统公司(Conexant Systems, LLC)
是CE行业的软硬件解决方案的主要提供商,在音频和语音应用支持上表现卓越。
科胜讯已有方案:CX20921(2ch模拟mic输入)、CX20924(4ch数字PDMmic’输入),这两款均是面向远场语音识别的前端处理芯片,支持降噪、回声抑制等基本功能。由于是内置CODEC的DSP,还可以做协处理器做一些前端算法,譬如语音唤醒等。
(5)杭州国芯科技股份有限公司
杭州国芯将推出支持8ch PDM输入的解决方案
(6)北京君正集成电路股份有限公司
北京君正推出了第一颗专门针对物联网设计处理器X1000,支持4mic的音箱应用,接口为数字PDM类型。
【关于麦克风选型】
1、类型选择:主要取决于主芯片SOC的音频接口,简单来说就是SOC有什么接口就选什么硅麦。譬如瑞芯微的RK3229支持8ch I2S,就选择I2S最合适。
2、性能选择:同类型硅麦,灵敏度一致性±1dB有利于降噪,SNR提高有利于语音识别率提高。
3、结构选择:根据整机堆叠空间来选择top(前进音)或bottom(后进音)类型
4、信号格式:模拟硅麦、PDM、I2S、TDM分别是集成度逐渐提高的四类,成本逐渐增加,在SOC支持对应接口的前提下,集成度越高硬件电路越简洁。
【敏芯特色产品系列】
更多麦克风产品详情,可联系我司相关人员获得技术支持和帮助:
电话: +86 512 62956055
邮箱: [email protected]