专栏名称: 雷峰网
中国智能硬件第一媒体
目录
相关文章推荐
新浪科技  ·  #黄仁勋称中国在AI领域会做出巨大贡献#【# ... ·  3 小时前  
涵江时讯  ·  早安!涵江! ·  19 小时前  
DeepTech深科技  ·  英伟达发布Blackwell架构升级版,推出 ... ·  昨天  
新浪科技  ·  【游戏工委:#2月中国游戏市场收入279.3 ... ·  2 天前  
青云说说  ·  如何定义好酒? ·  2 天前  
青云说说  ·  如何定义好酒? ·  2 天前  
51好读  ›  专栏  ›  雷峰网

专访 | 钱晨:为什么 “智能音箱” 可能会被做臭?

雷峰网  · 公众号  · 科技媒体  · 2017-04-25 22:04

正文


雷锋网按: 卸任锤子科技 CTO 之后,钱晨加入数字家圆,参与了一款视频通讯设备——亲见 H1 的研发,做的是他老本行——声学,其中最核心的工作便是远场语音识别。远场语音识别也是 Amazon Echo 的核心技术之一,Echo 的火爆点燃了整个市场,但钱晨告诉雷锋网,他并不认为这是 “最好的时代”。

1998 年,钱晨在中科院顺利拿到了水下声学博士学位,很长一段时间,他在北京摩托罗拉研发中心担任电子与声学工程师。

他现在担心的是,百家争鸣背后,“智能音箱” 这个概念会被做臭,就像他玩石头从来不碰田黄,因为一说到田黄,他第一反应就是赝品。

以下是钱晨自述,由雷锋网整理。

这么说吧,做前端声音处理的,国内没有高水平的。因为我们这个专业,一年毕业不到 50 个学生,大家都知道,这个水平不会太高。但是美国人比较有意思,美国人做物理比咱们深,物理做深了以后,它就能解开一道道题。

麦克风这个行业,有两个流派。一个是说自己有 6 个、7 个麦克风(Amazon Echo)的那种,叫麦克风阵列;第二个流派就是 “两麦”(Google Home)。从这一点出发,不管厂商怎么讲故事,都逃不出这两个。

麦克风阵列流派的缺点是夹角窄。

展开之前得先谈一谈 “波束形成”。波束形成实际上 20 年前就有人做了。军工里的声纳,微波里的智能天线,都是这个技术。

当时大家为什么用波束形成?主要是因为做电路的时候就是处理各种放大信号,而波束形成本身就是一个放大信号,我们管这个放大叫空间增益。对空间场的增益还有一个公式,根据它,能做出很多技术创新来。

亚马逊做 Echo 的时候就用了这个技术。这个技术体现在产品上,就是它能识别声音传来的方向,然后把旁边的声音滤掉,把需要的声音增加了空间增益。对比到电路上,就是这个信号的放大倍数多,信噪比好,信号被放大以后,很干净。

麦克风阵列就是用这个阵列形成一个波束,波束角是 60 度。

“两麦” 没有夹角窄这个问题,它也有空间信息,能分辨出来声音是左边来的还是右边来,但它没有增加放大量。







请到「今天看啥」查看全文