专栏名称: 小葱看电子

王聪与您分享电子行业研究观点

【国君电子王聪团队-行业深度】智能声学创新开启语音交互新时代

小葱看电子 · 公众号 · · 2018-01-14 22:09

正文

请到「今天看啥」查看全文

欢迎交流：王聪 13918566336/ 陈飞达 18817846285

本报告导读：

软硬件的进步使得声学智能化创新开启，智能音箱将成为移动互联网之后稀缺的入口，智能耳机结合移动语音交互与生物监测有望标配，国内厂商深度受益行业变革。

摘要：

声学创新开启语音交互新时代，首次覆盖给予“增持”评级： 声学创新的意义不仅仅在于提升产品的音效表现，更重要的是通过麦克风阵列、 AI 技术、语音交互软件的配合，声学产品的能力范畴得到了极大的拓展。麦克风阵列解决了远场语音交互问题； AI 技术的出现使得语音识别准确度得到了快速提升；第三方语音交互应用软件不断增多，功能涉及全面。过去声学行业创新局限于声学零件性能指标的稳步提升，当前以智能音箱、智能耳机为代表的声学智能化创新将推动行业加速发展， 首次覆盖，给予行业“增持”评级 。

我们推荐： 声学智能化创新将带来芯片、麦克风阵列、扬声器、组装等新增市场，我们推荐：在消费电子声学领域深度布局，为 HomePod 独供扬声器的国光电器； MEMS 麦克风龙头、具备智能声学产品 ODM 能力的歌尔股份；切入大客户声学供应链的立讯精密 ;

智能音箱市场迎来爆发，未来 5 年 CAGR 高达 51.6% ： 以智能音箱为代表的声学创新产品将成为移动互联网之后的稀缺入口，而且其自带控制中心属性，将成为智能家居的核心，因此市场迎来爆发。根据 VoiceLab 的数据显示， 2015 年全球智能音箱销量为 170 万台， 2016 年销量为 650 万台。随着产品多元化、功能不断完善以及价格持续亲民，预计 2017 年全球智能音箱设备出货为 2600 万台，到 2021 年有望达 1.37 亿台， 2017 至 2021 年 CAGR 为 51.6% 。

移动语音交互结合生物监测，智能耳机有望标配： 在近距离语音交互中智能耳机将发挥重大作用，尤其在户外、旅途等的“ On-The-Go” 的移动场景。同时耳部更适合健康数据的收集，目前已实现用耳机检测包括血压、心率、心电图和核心体温等在内的各项体征数据。我们认为兼具移动语音交互与生物监测的智能耳机将热销，根据 Statista 的数据显示 2016 年至 2020 年，全球智能耳机的 CAGR 高达 93% ，预计从 2016 年的 500 万副增长至 2020 年的 7100 万副，整个智能耳机行业在 2020 年市场规模将超过 400 亿美元。

中国企业占据核心位置，受益产业发展： 智能声学创新将带来芯片、麦克风阵列、扬声器、组装等新增硬件需求，其中芯片成本为大头，麦克风阵列使得 MEMS MIC 用量大幅上升， HomePod 将带动高品质扬声器需求。当前中国企业已在产业链中占据核心位置，将受益于产业发展。

风险提示： HomePod 使用效果不及预期，语音交互产业发展不及预期

1. 软硬件逐渐成熟，助推音箱智能化创新

过去声学领域主要的产品类型为家庭影院、数码音箱、有线耳机等产品，当前声学领域的一大变化在于智能音箱与智能无线耳机产品在快速普及。我们认为软硬件的进步与成熟是推动声学产品功能与形态升级的核心原因，同时软硬件的升级将拓展声学产品的能力范畴，声学产品有望成为语音交互的最佳入口，智能家居的控制中心。

1.1. 语音交互 / 远场拾音技术进步，催生声学创新

1.1.1. 语音交互为本能表达，带来全新体验

早期的人机交互主要利用键盘，如打字机和DOS系统的电脑。随着鼠标的发明和可视化图形界面的普及，人机交互迎来了第一次重大创新。随后触摸屏的普及以及多点触控的出现，令人机交互进入了二维层面。相比鼠标和键盘，多点触控能更方便、多样的实现输入。但是至于此，人机交互依然没有脱离手动的信息输入，在人机分离下无法实现互动，语音交互的出现将使这一问题得到解决。

语音交互是基于语音输入的新一代交互模式，通过说话就可以得到反馈结果。语音交互的关键性步骤主要包括：语音识别（ASR）、自然语言理解（NPU）、对话管理（DM）、自然语言生成(NLG)和语言合成（Speech Synthesis），每一步算法的提升都会带来更好的使用体验。

语音交互的出现，一方面能实现人机分离情形下的互动，另一方面在人机交互领域激活了人类最本能沟通方式（语言）。

语音交互贴合人类表达本能

（ 1 ）信息密度高，自然且普适

语言是人类与生俱来的一种能力，从学习成本角度而言显著低于其他手段，语音交互天然适合人类。从普及度而言，几乎人人都会用语言进行沟通，但是在全球范围内依旧有许多不会书写文字的人。假设语音交互能够普及，在理想状态下人人都可以用语音命令操控智能设备，实现智能体验。

语音是人类最方便高效的信息沟通方式，根据 Ratatype 的数据显示，键盘打字的平均速度为每分钟 41 个字，而人每分钟平均可以说 150 个字，可见在输入效率上，语音的信息交换密度远远领先于键盘输入。

（ 2 ）解放双手，更少的感官占用

除了高效的信息沟通外，语音交互可解放双手、眼睛，不需要与设备接触即可沟通，使得我们能够实现一心多用和在特定情况下精力集中。诸如在处于驾驶状态时，我们就可以通过语音助手来查看智能手机上的信息，从而避免视觉查看而导致的注意力不集中。根据 Statista 的调研数据显示， 2016 年美国用户使用智能语音识别主要原因中，双手和眼睛被占用为首要理由，占比达 60% 。可见智能语音识别对于提升用户便利性有很大的帮助。

1.1.2. 软件端：方案不断发布， AI 技术提升识别准确度

（ 1 ）各类语音交互软件不断面世

近期三星发布了其语言识别助手Bixby，正式用于S8系列、Note8手机。事实上，从产品推出的时间顺序来说，三星Bixby还只能算作是智能语音交互领域的一位新玩家。在Bixby之前，就已经有了诸如苹果Siri、微软Cortana、谷歌Google Assistant、亚马逊Alexa等在内的多款智能语音助手被业界熟知。

（ 2 ） AI 技术提升语音识别准确度

在提升语音识别的准确度上，过去主要依靠算法的进步和样本的积累，随着深度学习算法的出现，语音识别的准确率有了明显的进步。深度神经网络算法可以把连续多帧的语音特征并在一起，构成一个高维特征，最终的深度神经网络可以采用高维特征训练来模拟。由于深度神经网络采用模拟人脑的多层结果，可以逐级地进行信息特征抽取，最终形成适合模式分类的较理想特征。

深度神经网络的建模技术，在实际线上服务时，能够无缝地和传统的语音识别技术相结合，在不引起任何系统额外耗费情况下，大幅度提升了语音识别系统的识别率。

当前在引入深度学习算法后，百度和谷歌的语音识别准确率都超过了 90% 。在安静环境下，百度语音识别甚至可以做到 95% 以上的准确率。

IBM通过引入深度学习算法，使得其在电话语音识别上的错误率不断下降，2017年的最新数据显示，其错误率仅为5.5%，已经接近人类水平。

（ 3 ）语音搜索普及度提升，第三方应用进一步促进行业发展

随着语音识别准确度的不断提升，用户显著增多。谷歌提供的数据显示，其谷歌语音搜索量较 08 年相比增长 35 倍。语音识别已逐步改变搜索领域，百度甚至预计， 2020 年所有搜索中至少 50% 为语音或图像搜索，语音识别已成为生活的一部分。

除了语音搜索使用量的显著提升外，基于语音交互的第三方软件快速增加，吸引了越来越多的用户，这对普及语音交互起到了巨大作用。以亚马逊Alexa为例，当前的第三方语音交互应用数量已经超过1万个，而在2016年6月刚过1000个。当前随着第三方开发者越来越多，Alexa会的本领技能越来越广泛，除了购物、打车、控制电器等功能外，还新闻、游戏、教育等方面的技能。

1.1.3. 硬件端：麦克风阵列解决远场语音交互难题

在硬件端，语音设备主要包含：芯片、扬声器、麦克风、结构件等，再经过ODM形成完整产品。芯片、扬声器、结构件、ODM等环节皆已成熟，且和传统声学方案差异不多，差异较大部分在于麦克风。语音交互依赖麦克风拾音，在手机等近距离使用的设备上传统的麦克风即能满足拾音需求，而在远距离、嘈杂环境下，传统麦克风使用效果欠佳，麦克风阵列是解决这一问题的最佳手段。

麦克风阵列（Microphone Array）指的是麦克风的排列，用来对声场的空间特性进行采样并处理的系统。麦克风阵列，其实就相当于机器之耳，主要解决远距离语音识别的问题，以保证真实场景下的语音识别率。在这过程中需要完成采集音频，识别信号，传输信息等步骤，为了顺利完成以上步骤需要具备声源定位、噪音降解、杂音屏蔽等功能。

除了国际品牌厂商外，国内供应商也推出了诸多麦克风阵列解决方案，主要包括：讯飞的 2 麦、 4 麦和 6 麦方案，思必驰的 6+1 麦方案，云知声（科胜讯）的 2 麦方案，以及声智科技的单麦、 2 麦阵列、 4 （ +1 ）麦阵列、 6 （ +1 ）麦阵列和 8 （ +1 ）麦阵列方案。

1.2. 行业巨头入局，市场迎来爆发

从1970年代起，语音助理（Virtual Personal Assistant）产品就陆续面世。尤其是近年来，在解决了软件端和核心零组件的技术问题之后，以智能音箱为代表的远场语音交互设备不断涌现。亚马逊、Google、苹果、京东、阿里等巨头相继发布了自家智能音箱产品。

根据 VoiceLab的数据显示，2015年全球智能音箱销量为170万台，2016年销量为650万台。其中2016年Amazon Echo销售超过400万台，同时亚马于9月27日在西雅图推出了第二代智能音箱家族：Echo、Echo Plus 和带屏幕的 Echo Spot，分别针对入门需求，智能家居需求以及桌面端的智能音箱需求。随着产品多元化以及价格不断亲民，预计2017年Amazon Echo销售超过1500万台。预计2017年全球智能音箱设备出货为2600万台，到2021年有望达1.37亿台，2017至2021年CAGR为51.6%。

2. 智能音箱：语音交互的入口，智能家居的中心

软硬件的成熟是智能音箱爆发的必要条件，但不是充分条件，我们认为厂商的大力推动才是核心因素。近年来，传统音箱企业、消费电子企业、互联网巨头纷纷加入战局，先发者如亚马逊Echo、天猫精灵X1则在促销季以低于硬件成本的姿态进行降价促销（Echo降价50美元至149美元促销、天猫精灵从499元降至99元）。各种迹象表明，智能音箱对厂商而言绝不是一个以获取硬件利润为目的的产品，对用户而言智能音箱基本的音乐属性是吸引其购买的基础，基于语音交互的拓展功能则是吸引其购买的关键。智能音箱是在传统音箱的基础上增加了智能化功能，体现在两方面，一、技术上具备Wi-Fi连接，可语音交互；二、功能上，可提供音乐、有声读物等内容服务、信息查询、外卖、O2O等互联网服务，以及场景化智能家居控制能力。

2.1. 始于音乐，但又不止于音乐

智能音箱极大拓展了传统音箱的其能力范畴，就音乐这一特质而言，智能音箱不仅保留而且进行了加强。从消费者购买原因的调研来看，听音乐仍然是首选选择，占比高达90%。控制智能家居设备占比48%，替代老旧音箱占比36%。

智能音箱在音乐播放上优势明显

传统音箱通过蓝牙方式连接手机、平板、电脑等设备，以上设备下载音乐资源后将其进行蓝牙编码，传输至音箱进行播放，因此传统音箱更多的是充当一个“扬声器”的功能。因为智能音箱更为出色的硬件性能与网络连接能力，其在音乐播放功能上优势明确。

1 ）更高的带宽：传统蓝音箱带宽一般都在24Mbps，不足以传输高品质音乐。智能音箱采用WiFi联网，带宽在150Mbps以上，方便无损音乐的传输；

2 ）多音箱互动：多个智能音箱间可以组网，构成同步播放网络，在不同房间中形成同步播放，提升使用体验；

3 ）云端曲库，资源丰富：智能音箱自身即可上网连接各类音乐APP进行歌曲播放，互联网的海量音乐资源可以为智能音箱所用。

音乐数字化趋势明确，在线音乐已为主流

伴随移动互联网时代发展，音乐数字化步伐不断前行，从全球的数据而言，音乐产业数字化营收比例已经达到了45%，仅次于游戏60%的份额，远超电影、书籍等其他内容的数字化营收。

就算是在版权保护较弱的中国市场，近年来网易云音乐、虾米音乐、QQ音乐等主要音乐门户已经开始加强音乐IP控制，前四大门户合计占比已接近90%。在线音乐市场发展与在线音乐用户的增加相辅相成，伴随着优秀内容提供商的出现，中国家庭对于网络音频的需求越来越高。根据艾瑞咨询的数据示，2015年中国在线音乐用户已达5亿人，在线音乐市场收入规模已达百亿元。在线音乐市场的繁荣对智能音箱市场而言是持续的利好，以智能音箱为代表的WiFi连接和播放形式将为成为主流。

不止于音乐，有声读物不断丰富

对于智能音箱来说，内容不再仅仅只是音乐一种，而是包括各类有声资源。以叮咚智能音箱为例，通过与百度音乐、考拉FM、喜马拉雅FM、得到、今日头条、腾讯等的合作，叮咚智能音箱搭建了更多的音频内容，让用户有更多的内容可以在智能音箱上进行选择，满足用户对于内容的全方面需求。

2.2. 移动互联网之后又一核心入口，价值凸显

为何苹果、三星、谷歌、微软、亚马逊等科技巨头，都不约而同的将大量精力投入到了智能语音交互领域，而且争相推动其智能音箱产品的销售？我们认为原因如下：

1 ）音箱本身不是目的，厂商争夺的是移动互联网之后的稀缺入口。 与以往不同的是这一入口以语言的形式进行输入和输出。在即将到来的万物互联代，次类型的入口以及语言交互的形式极有可能会成为主流；

2 ）智能音箱是语音交互真正落地的第一款产品，而且其自带控制中心属性，将成为智能家居的核心。 厂商通过让用户把产品带回家，观察后续的使用情况，是最好的测试和改进方法。

智能音箱以其小巧轻便、相对固定的位置摆放，可居于客厅、厨房、卧室等多个场景中，提供提醒、社交、娱乐等服务，以及购物、外卖、出行、缴费等生活服务，同时作为家居控制中心，通过智能家居可实现对照明、电视、窗帘等家居产品的控制、未来生活更为智能和便利。根据艾瑞咨询的数据显示，2016年智能家居穿透率普遍不超过5%，例如门锁3.5%、照明系统2.1%、洗衣机1.8%、冰箱1.1%，到了2020年预计都将各环节智能化渗透率都将超过20%。中国智能家居市场规模也将在未来几年保持超过50%的增速，预计到2020年将达3294亿元。

3 ）语言交互在公开场合私密性差，家庭环境下使用率最高。 语音交互是最为自然低成本的交互模式，但在多数时候我们的行为需要考虑、符合周围环境和保持本身的私密性，公开场合下的语音交互有悖于这一原则。所以智能手机的语音交互，在更多的时候充当的是培育用户对语音助手初步认知和使用习惯的角色，而语音交互真正能够大展拳脚的地方，更可能的是在智能家居物联网领域，这里有着语音识别更为理想的使用环境。根据调研数据显示，2016年美国人使用语音交互最多的场景是在家里，相比通过打开APP，通过语音去放歌、控制家居是更为便捷的方式。

正是因为看着这一入口价值，当前各类厂商纷纷进入智能音箱市场抢占红利，包括：互联网巨头、传统音箱厂商、技术提供商、内容厂商、IT巨头。以上积累厂商具备的优势与能力都不同，科技巨头强在生态体系、内容厂商强在旗下内容具备忠实用户。

2.3. 产品不断面世，市场迎来爆发

目前各大巨头已经在智能音箱与语音交互的探索上迈出了实质性的步伐，亚马逊的Echo是行业的先行者，其为语音交互找到了合适的运用场景。谷歌推出了搭载Google Assistant的Google Home智能音箱，微软联合微哈曼卡顿推出了搭载Cortana的Invoke智能音箱，并还要将Cortana扩展到汽车场景；苹果在HomePod、Apple TV、Mac等产品上亦是搭载了Siri语音控制系统；三星也推出了其语音助手Bibxy，在三星的规划中其也不仅限于智能手机，而是将会应用到物联网领域，扩展到三星的所有产品品类之中，诸如冰箱、洗衣机、电视机等产品之中，并且将会对外开放，打造基于Bixby的人工智能生态。

2.3.1. 国际品牌：软件体系完善，引领市场风潮

亚马逊：行业领导者， Echo 生态不断完善

1 ）产品线丰富

亚马逊是智能音箱市场当之无愧的开拓者和领导者，其智能音箱产品Echo于2014年11月正式推出，最早仅提供为网站Prime等级客户购买，2015年扩大至全美客户。

2 ）出货量过千万，市占率第一

自推出以来，Echo智能音箱系列以傲人的成绩一直充当着行业的标杆。销售方面，在整个2015年，亚马逊一共卖出了250万台Echo设备。而这个指标在2016年达到了惊人的650万，在全球智能音响市场占有率更是达到了巅峰的88%。Echo仅在发布后的两年时间就击败传统音箱巨头Sonos，取得在线音箱份额第一的霸主地位。

3 ）支持软件众多，应用丰富

由于上市时间最早，Echo的软件支援最为完善，截止2017年三季度 Alexa Skill共有2.5万种，而Google Assistant只有不到1000种。在流媒体的资源上，Echo支持包括Primemusic、潘多拉、Amazonmusic等诸多APP。在智能家居方面，Echo同样支持面很快，包括：Smatthins、Nest等。

4 ）配置出色

配置方面，亚马逊Echo搭载TIDM3725CUS100 Digital Media处理器，配置256MB RAM+4GB内存组合，支持Qualcomm Atheros WiFi，内置蓝牙模块，2.5英寸低频扬声器（1个）、7英寸高频扬声器（1个）和7个麦克风。Echo主要电源与驱动主板、主板及扬声装置组成，其中主板成本占比最高，约占50%左右，单体成本大约在100美元左右。

苹果： HomePod 发售在即，更注重音乐本质

2017年6月6日，苹果在开发者大会（WWDC2017）上隆重推出其智能音箱HomePod，这也是苹果自2013年以来首次在WWDC上发布硬件产品。

配置方面，这款智能播放器配备了苹果自行设计的低音播放器，并且配置了A8芯片进行低音管理。此外，还配置配备了7个高频扬声器、1个低音单元，该配置使得HomePod的音质要好于市面上大多数音箱。跟Amazon Alexa、Google Home、Harman/Kardon Invoke这些强调智能助理的音箱所不同，Apple更强调自己的音乐基因。所以在WWDC发布会上介绍HomePod的时候给出了三大特性，全部都是跟音乐有关的：

1 ） Rock the home ： 声音足够大，音质足够好，全家乐翻天；

2 ） Spatial awareness ： 可感知到空间位置，通过机器学习自动调节声音播放和人声识别；

3 ） Musicologist ： 深度集成 Apple Music ，四千万首歌随时播；

从交互角度来看，HomePod植入了苹果系统已有的智能语音控制功能Siri，利用配备的六个麦克风，Siri 能够更加精确地定位人声的位置。用户可以非常方便的将 iPhone 手机与 HomePod音箱相连。只需要拿着 iPhone 手机靠近HomePod 音箱，这两个设备就可以相互识别，识别成功后几秒钟后HomePod 就可以播放 iPhone 手机上的音乐。另外，HomePod将搭载Siri语音助手，与IOS深度整合，实现查询、发送消息、提醒通知等功能，并且通过HomeKit集成智能家庭的控制中心，实现对智能家居产品的控制。

谷歌：算法能力强大，整合多样成熟服务

2016年5月19日，在年度I/O开发者大会上，谷歌发布了其智能音箱设备Google Home。Google Home只有一个物理按钮，当你不想听它说话或者想要安静的时候，这个按钮就是静音键使用。除此之外，Google Home大多数的功能都通过语音命令控制，另外还有顶部的触控电容面板可以用来调节音量、暂停以及停止提示音。

配置方面，根据ifixit网站对于Google Home的拆解，Google Home顶部采用两麦的线性麦克风阵列，分置面板的左右两边。面板中间有12颗LED灯珠，搭载一块Atmel SAM D21微控制器，和两块NXP 的LED照明驱动芯片。另外Google Home使用的是Marvell（美满）的主控芯片，东芝的4Gb flash芯片，德州仪器TAS5720的数字功放芯片，三星的4Gb内存芯片以及美满的WiFi、蓝牙、NFC集成芯片等。此外为了丰富产品线与竞争对手抗衡，谷歌发布了价格更低、尺寸更小的Home Mini，以及走高阶音乐路线，价格昂贵的Home Max。

另外 Google Home 支持多用户，最多可以识别 6 人的声音。我们可以根据不同家庭成员的声音来训练 Google Home ，这样当不同声音的用户询问相同的问题，答案也不同。

对比亚马逊的 Echo 系列， Google Home 的配置和功能并没有很大的差别，并且在麦克风数量上还远远少于其他智能音箱厂商。但谷歌对于语音的手机和识别并不是侧重在麦克风的数量，而是使用了其独特的算法和深度学习技术。依靠背后优秀的算法，谷歌语音识别准确率优于其他语音识别系统。另外依托谷歌本身已经构建的出色产品体系， Google Home 通过网络连接可以方便的调用，在搜索服务、对话流畅性等方面都强于竞争对手。

2.3.2. 国内品牌：本土化优势明显，语言限制有望突破

中国厂商在智能音箱上跟进的速度很快，仅在 Echo 发布后的第二年，中国市场就出现了第一款较为成熟的本土智能音箱——叮咚音箱。该款音箱由京东与科大讯飞成立灵隆科技联合推出，是互联网电商与技术厂商的一次完美合作。据调研公司“易观”统计，截止 2017 年上半年，京东智能音箱叮咚在京东平台上的销量已占据智能音箱的 80% ，在整个中国智能音箱市场销量也占据第一的位置。

国内的智能音箱厂商则更加侧重产品定位的差异化，本地化优势明显。通过与支付宝口碑、滴滴出行等第三方应用的合作，中国品牌智能音箱可以提供查询周边、餐厅促销信息、路况、火车、机票、酒店等信息。其中比较有代表当属叮咚智能音箱和天猫精灵 X1 ，通过自身依靠的强大电商平台，用户通过语音可以在音箱上是实现购物，或者借助第三方应用，实现其他类型的 O2O 服务，比如：打车、订机票、餐厅、查物流等，让用户可以在不打开手机的情况下，进一步方面人们的生活。

当前中国市场智能音箱销量远低于海外，除了消费习惯的问题外（海外消费更爱听音乐，家庭音箱普及度达 85% ，中国仅 20% ），当前中文 VPA 也是限制因素，原因在于： 1 ）相比英文，中文在语法、语音、语调上更为复杂，仍需要大量的时间去积累； 2 ）英文 VPA 生态体系以为几大科技巨头的推动，当前已经构建的相对完善。随着搭载科大讯飞、百度等语音交互系统的产品不断面世，中文语音资料库不断积累，我们预计中文 VPA 将会很快得到提升。

3. 智能耳机：声学领域另一重大创新方向

如果说智能音箱是实现远场语音交互的利器，那么在近距离贴身设备的语音交互中，除了传统的手机外，未来的一大表现形式将为智能耳机。耳机作为电子设备重要的发声设备，拥有良好的便携性、隐私性和隔音效果，在人们生活中发挥着不可替代的作用。进入互联网时代，随着蓝牙和 WiFi 等无线技术的发展，以及 Type C 和 Lightning 接口在手机端的普及和进化，传统耳机正面临着巨大变革。智能耳机的出现使得耳机的功能和应用场景发生了极大地拓展。

3.1. 苹果带动市场发展，用户满意度极高

苹果推出 AirPods ，产品品质出色

在 iPhone 7 推出后，苹果取消了 3.5mm 耳机孔，并推出它们的解决方案：AirPods无线耳机。该耳机售价为1288元，可通过内置的W1无线芯片与iPhone 7配对，续航在5小时左右。通过使用附带的充电盒，这副耳机的续航可以达到24小时。苹果在 AirPods 中内置了一颗定制的 W1 芯片，支持BT4.2标准，覆盖的传输距离广泛，音质极佳。

AirPods 除了配备了 W1 处理器以外，还配备了 Maxim 音频编译码器， Bosch BMA280 加速度计等，小小的身躯下包含了当前声学的最高技术。

AirPods 成为爆款，带动智能耳机市场

据Slice Intelligence统计，AirPods 上市当日，全球线上耳机的销售超过黑色星期五和 Cyber Monday（网络星期一），成为耳机市场单日交易量最大的一天。这个数字是 2016 年单日销售平均值的 10 倍左右。足以证明人们对于AirPods的喜爱程度。

截止 2017 年第三季度， AirPods 已经占据无线耳机细分市场的主导地位，并推动无线耳机销量大幅增长，其销售额占到该细分市场总额的 85 ％。

AirPods对消费者的吸引力巨大，人们对于AirPods的喜爱程度甚至超过了Apple Watch。据Creative Strategies and Experian调查显示，使用者于AirPods的满意程度达到了惊人的98%。其中快充，设计以及配对速度受到的好评最多。调研机构IDC预测，2017年苹果AirPods的营收将达到3513.9百万美元，超过Apple Watch的2800百万美元。

3.2. 移动语音交互结合生物监测，智能耳机不再鸡肋

智能耳机适合移动语音交互，布局“ On-The-Go” 场景

智能音箱的语音交互主要以人们生活的房间为使用场景，运用的主要是远场语音识别。但是在户外、旅途等所谓的“ On-The-Go ”的移动场景里，智能耳机显然要比智能音箱更具有优势。相比于智能音箱，智能耳机的语音交互使用率更高，且更个人化。在远场语音下，用户总是要保证与声源的距离，才能完成语音交互，若声源距离较远，音量不够大，语音识别率将会大受影响。而智能耳机离人的语言器官较近，语音识别难度大幅度降低。

智能耳机中语音交互功能的加入，使人们对智能设备的沟通开始从指令性向个人化进行转变。由于与耳机的沟通形式更像是与电话中的朋友交谈，人与智能耳机的互动更自然、更便捷。就如同电影《 Her 》中男主角和人工智能“萨曼莎”之间的关系，语音交互将通过智能耳机真正融入到人们的生活。

集成生物监测功能，智能耳穿戴不再鸡肋

目前对于人体生物检测技术的应用主要在于可穿戴设备。但是由于可穿戴设备功能的有限以及对外部设备（如智能手机）的依赖，可穿戴设备在人们生活中的使用频率和影响程度十分有限。而将生物检测技术整合到已经具有用户粘性的耳机上，一方面为生物检测技术找到了更好的载体，另一方面也使智能耳机本身的功能进一步增加。

传感器设计公司 Valencell 表示，耳部其实比身体的其他任何部位都适合健康数据的收集。用耳机检测包括血压、心率、心电图和核心体温等在内的各项体征数据，远比使用智能手环来的准确。另外，将 GPS 、加速传感器和作为声音处理单元的耳机结合在一起，耳机就可以在智能上更进一步。目前已经有智能耳机（如 Gear IconX 2018 ）实现了监测用户心率、计算运动过程中燃烧的时长、路程、卡路里等功能。

引入主动降噪，声学性能进一步提升

传统耳机的降噪只要依靠被动降噪，利用耳机耳罩物理结构设计和物理材料的选择极大减少外界声音的进入。智能耳机则可以通过配备的微型扬声器和芯片，可以通过产生与噪音相反的声音消除噪音的影响。

传统的主动降噪技术对于噪声的分析是基于事先植入的几种特定参数，耳机对于噪音的抑制只能从事先配置好的几种算法中去选择。随着人工智能和深度学习技术的发展，耳机的主动降噪技术逐渐开始摆脱了原本设定参数的限制，可以对多个场景进行深度学习，在每个场景下找到最优滤波器参数，为智能耳机提供了更优秀的降噪效果。

3.3. 厂商积极推进，未来有望标配

目前布局智能耳机的既有智能手机巨头也有传统耳机商，主要涉及的公司有苹果、三星、索尼、谷歌等， 2016 年苹果公司的 AirPods 的发布催生了一大批智能耳机的出现。

我们认为智能耳机将在无线连接、智能降噪、语音交互和生物监测等领域发挥重要的作用，未来将成为智能手机的标配。据WiFore Consulting的报告《智能耳机市场2016-2020》显示，苹果airpods的入场，带来了智能耳机市场的变革，整个智能耳机行业在 2020 年将可能成为一个超过 400 亿美元的市场。

从出货量而言，根据Statista的数据显示2016年至2020年，全球智能耳机的CAGR高达93%，预计从2016年的500万副增长至2020年的7100万副。

4. 产业链：中国企业占据核心位置，受益产业发展

智能声学产业链主要供应商包括：1）芯片供应商；2）声学元件（麦克风阵列、扬声器）供应商；3）语音交互方案提供商；4）OEM/ODM；5）内容提供商。

4.1. 芯片：成本大头，传统芯片大厂领导市场

智能音箱由于功能的高度集成以及强大的语音交互能力，必须要有一个强大的心脏——主芯片。主芯片承担了算法降噪、人工智能训练等绝大部分机器学习的任务，在架构上主要采用ARM结构。目前智能音箱的主芯片供应商包括TI、联发科、Intel等。Amazon Echo采用了TI方案，由于Echo Show和Echo Spot需要处理影像，所以改用了Intel的解决方案，苹果的HomePod则是采用自家A8芯片。除主芯片外，内存芯片、WiFi蓝牙芯片、电源管理IC也是必不可少的构成部分。

成本方面，以亚马逊的 Echo 与国内的叮咚音箱为例，芯片都是整个设备成本中占比最大的一块，其次是智能音箱的声学单元。

目前智能音箱的主芯片提供商除了芯片界的传统强者（英特尔、联发科、高通和苹果），联发科的代表产品为专为智能语音助理装置和智能扬声器产品而设计的系统单芯片MT8516。高通推出“智能音效平台Smart Audio Platform”，在这个平台上，高通提供了两款新的系统级芯片，基于骁龙425（APQ8017）芯片和骁龙212芯片（APQ8009）针对音频处理进行优化。

国内的芯片厂商利用本土优势积极进入国内智能音箱市场，占据了一席之地。以全志科技为例，2015年发布的国内第一款智能音箱——叮咚音箱使用的就是全志科技的R16芯片（Cortex-A7四核架构）。此外国内厂商瑞芯微电子和紫光展锐也相继发布了自己的“AI语音助手”芯片，并与国内智能音箱厂商取得合作。

4.2. 麦克风：阵列为主流方式， MEMS MIC 用量快速提升

手机在使用的过程中由于低噪声、无混响、距离声源很近，所以大多采用单麦克风系统。智能音箱在实际使用中会比使用手机的距离远，真实环境存在大量的噪声、多径反射和混响，导致拾取信号的质量下降，这会严重影响语音识别率。智能音箱单麦克风接收的信号，是由多个声源和环境噪声叠加的，很难实现各个声源的分离，从而无法实现声源定位和分离，更重要的是将会导致语音识别不能同时识别两个以上的声音。因此为了解决这一问题，即“远场语音识别”，利用麦克风阵列进行语音处理的方法应时而生。

麦克风阵列主要由一定数目的声学传感器组成，用来对声场的空间特性进行采样并处理的系统。从形状上来看，麦克风阵列主要有一字、十字、平面、螺旋、球形及无规则阵列等，而阵元的数量可以从2个到上千个不等，智能音箱所用的麦克风阵列阵元的数量一般不会超过10个。

麦克风阵列的性能是智能音箱能否清晰接收到用户指令的关键，对厂商来说单个 MEMS MIC 的质量以及整个阵列效果都至关重要。主要的智能音箱厂商，包括亚马逊、谷歌、苹果都有自研的解决方案，当然一些缺乏经验的厂商可以采用如科大讯飞、 AISpeech 的解决方案。

传统ECM在阵列麦克风上组装不易且价格过高，当前多采用MEMS麦克风，麦克风阵列的使用将大大增加MEMS麦克风的需求。根据Digitimes的数据，2016年全球MEMS麦克风出货44亿颗，预计到2018年为53.5亿颗。

目前主流的麦克风阵列方案公司包括：楼氏电子，歌尔股份，瑞声科技，ST，芯奥微，博世和敏芯微。

4.3. 扬声器：苹果带动音质提升，发声元件价值量大幅增长

扬声器作为传统音箱中最为重要的部分，与音箱的的音质息息相关。在传统音箱时代，音箱的音质是消费者最看重的部分。然而，智能音箱为了实现更好的语音交互将大量的成本和空间让给了芯片部分，在音质方面表现较差。以目前音质较好的 Google Home 和 Amazon echo 为例，两个音箱在 100Hz-2kHz 的频谱波动大，波动在 10dB 左右，音质表现依旧欠佳。

市面上大多数智能音箱仅仅配备1-2个扬声器，并且通过对于产品的拆解发现，大多数智能音箱采用的扬声器成本仅占总成本10%左右。

有别于其他产品的是苹果的HomePod配备了8个扬声器，单机价值有望达200元左右，在宣传上苹果也着重突出了音质的优势。我们认为随着苹果HomePod的发售，消费者与厂商对智能音箱音质的重视度有望会提升。智能音箱市场的扬声器业务的主要受益者包括：国光电器（HomePod），美律（亚马逊、谷歌）、致伸（亚马逊、谷歌），通力电子（谷歌、哈曼、天猫和京东）。

4.4. OEM/ODM ：全新产品形态带来业务增量

目前智能音箱的组装厂主要分两类：1）由智能音箱的某元件供应商担任组装厂；2）专门的组装厂；由元件供应商厂担任组装厂的好处在于其对元件特性的理解更为深刻，有助于核心部件品质的把控，比如台湾致伸（供应Amazon Echo声学元件，同时为Amazon Dot组装）。专门的组装厂则在大量生产上有丰富的经验积累，成本控制能力强。亚马逊和谷歌都委托富士康组装他们的产品，苹果的HomePod则由英业达组装。声学龙头歌尔股份近年来除了继续深耕声学零件业务外，在智能硬件ODM方面也走出了坚实的一步，公司有希望也有意愿切入到智能音箱产品ODM。

5. 行业评级及投资建议

声学创新的意义不仅仅在于提升产品的音效表现，更重要的是通过麦克风阵列、AI技术、语音交互软件的配合，声学产品的能力范畴得到了极大的拓展。麦克风阵列解决了远场语音交互问题；AI技术的出现使得语音识别准确度得到了快速提升，达到95%以上的高水准；同时第三方语音交互应用软件不断增多，除了购物、打车、控制电器等功能外，还涉及新闻、游戏、教育等方面。具备以上功能后，以智能音箱为代表的声学创新产品将成为移动互联网之后的稀缺入口，而且其自带控制中心属性，将成为智能家居的核心，因此市场迎来爆发。根据 VoiceLab的数据显示，2015年全球智能音箱销量为170万台，2016年销量为650万台。随着产品多元化、功能不断完善以及价格持续亲民，预计2017年全球智能音箱设备出货为2600万台，到2021年有望达1.37亿台，2017至2021年CAGR为51.6%。过去声学行业创新局限于声学零件性能指标的稳步提升，当前以智能音箱、智能耳机为代表的声学智能化创新将推动行业加速发展，首次覆盖，给予行业“增持”评级。

国光电器： 智能音箱爆发在即，独供HomePod扬声器带来明确业绩增量。（1）公司当前为HomePod扬声器独供，ASP达200元，目前处于正式发售前的备货状态。HomePod预计于2018年初发布，将为公司带来明确业绩增量；（2）公司为音箱龙头，受益于行业整体爆发是增长。预计智能音箱数量将从2017年的2600万台增长至2021年1.37亿台，CAGR高达51.6%，带来公司传统业务增长。

立讯精密： 声学器件份额提升，AirPods持续放量，声学业务步入成长快车道。（1）公司入主美特切入大客户声学供应链，17Q4开始业务明显好转，我们预计18年公司在大客户中份额将进一步提升；（2）AirPods成为苹果最新爆款产品，18年销量有望翻倍达到2000万只以上，立讯凭借卓越的精密制造能力，已晋升为AirPods ODM主力供应商，目前良率已达到较高水平，且公司继续扩充产线，18年开始无线耳机业务将大幅贡献业绩。

歌尔股份： （1）智能音箱采用麦克风阵列带动MEMS麦克风需求，歌尔在MEMS麦克风市场份额排名第二，受益于这一趋势。同时通过收购丹拿，公司具备了音箱用扬声器生产能力；（2）手机声学业务方面，苹果OLED版单价大幅提升，且明后年OLED出货占比显著增加。非苹方面，立体声、防水将成为中高端机型标配；（3）公司有望切入第二代AirPods ODM业务，且未来无线耳机有望成为手机标配；（4）智能硬件ODM能力不断扩展，从VR到AR，到智能音箱等一系列产品。

6. 风险提示

HomePod 使用效果不及预期

苹果试水智能音箱产品， HomePod 已经发布但尚未发售，存在功能创新使用体验不佳，不及消费者预期导致低销量的风险。

语音交互产业发展不及预期

语音交互尚处于探索阶段，尚未找到完善的盈利模式，存在未来发展不及预期的风险。

重点公司推荐

国光电器（ 002045 ）: 智能音箱爆发在即，公司明确受益

维持“增持”评级，上调目标价至27.3元： 公司为音箱业务龙头，当前为HomePod扬声器独供，且有望在2018年拿下苹果NB声学订单。因此我们上调2017-19年EPS至0.34（+6%）元、0.78（+26%）、1.09（29%），增速为131%、133%、36%。参考声学行业2018年平均25倍PE，考虑到智能音箱行业处于爆发式增长阶段，给予公司一定的估值溢价，2018年35倍PE，上调目标价至27.3元，维持“增持”评级。

智能音箱爆发在即，独供HomePod扬声器带来明确业绩增量： 智能音箱将成为智能家居控制核心及语言交互入口，已得到产业巨头共识，产品纷纷推出。预计智能音箱数量将从2017年的2600万台增长至2021年1.37亿台，CAGR高达51.6%。国光为音箱龙头，深度受益这一行业趋势，且公司为苹果HomePod扬声器独家供应商，业绩弹性明确。

募集资金扩充产能，产业园开租带来业绩增量： 公司拟定增10亿元投入微型扬声器与智能音响项目，其中智能音响项目完工后将新增2359万只音响用扬声器及40万套智能音响系统产能，积极拥抱产业趋势。微型扬声器项目将有望令公司切入NB等消费电子声学供应链。公司将其位于花都的产业园进行商业化建设，一期18.24万平米建筑预计于10月竣工，以周边60元/平米/的月租金计算，全部出租后租金收入过亿元，未来将提供稳定盈利。

风险提示： 智能音箱市场发展低于预期；竞争加剧；

立讯精密（ 002475 ）: 大客户平台型供应商，声学业务高成长可期

维持“增持”评级，目标价26.7元。 公司围绕大客户打造精密制造平台，声学、天线、无线充电、无线耳机、Type-C等业务齐放量，开启新一轮高增长。考虑到大客户新品发售时间及销量均低于我们此前预期，下调2017-19年EPS预测至0.55元（-15%）、0.83元（-7%）、1.11元（-2%），目标价29.05元，对应18年35倍PE，增持评级。

声学器件份额提升，AirPods持续放量，立讯声学业务步入成长快车道。 （1）公司入主美特切入大客户声学供应链，17Q4开始业务明显好转，我们预计18年公司在大客户中份额将进一步提升；（2）AirPods成为苹果最新爆款产品，18年销量有望翻倍达到2000万只以上，立讯凭借卓越的精密制造能力，已晋升为AirPods ODM主力供应商，目前良率已达到较高水平，且公司继续扩充产线，18年开始无线耳机业务将大幅贡献业绩。

多元化布局迎收获，立讯开启新一轮高成长。 公司围绕大客户打造精密制造平台型企业，拓展了无线充电、声学、天线、无线耳机、马达等多个产品线。（1）无线充电领域，公司是大客户无线充电发射端核心供应商，有望切入接收端，行业爆发趋势明确；（2）公司已切入大客户天线业务，后续份额有望持续提升，5G时代即将到来，手机天线价值量也将显著提升。（3）马达业务进展顺利，18年有望切入。

Type-C 大势所趋，通信、汽车连接器前景广阔。 立讯是Type-C领域绝对龙头，引领行业变革；通信、汽车连接器千亿市场空间，公司有望复制消费电子领域成功经验，逐步成长为全球连接器行业龙头。

风险提示： 大客户新品销量不及预期；行业竞争加剧。

歌尔股份（ 002241 ）: 智能音箱带来声学元件及 ODM 业务增量

维持“增持”评级，目标价24元： 智能音箱将带来MEMS麦克风阵列、扬声器等元件需求，同时释放ODM订单。公司具备声学元件供应能力，且已在VR领域证明其出色的ODM能力，未来有望切入智能音箱ODM业务。我们维持盈利预测不变，预计公司2017-19年EPS为0.69元、0.95元、1.19元，目标价24元，维持“增持”评级。

智能音箱带来增量订单，歌尔全面布局深度受益： 智能音箱采用麦克风阵列进行远场拾音，需采用多颗MEMS麦克风。全球MEMS麦克风需求预计将从2016年的44亿颗，增长至2018年的54亿颗，歌尔在MEMS麦克风市场份额排名第二，受益于这一趋势。通过收购丹拿，公司具备了音箱用扬声器生产能力，公司有望在2018年切入这一市场。同时结合出色的ODM能力，公司有望为智能音箱客户提供一站式服务。

声学升级持续，智能硬件ODM业务扩展，公司成长明确： 1）苹果引领手机声学升级，OLED版单价大幅提升，且明后年OLED出货占比显著增加。非A方面，立体声、防水将成为中高端机型标配；2）公司有望切入第二代AirPods ODM业务，同时随着高通等芯片厂商低功耗蓝牙芯片方案的发布，安卓阵营TWS有望爆发，未来有望成为手机标配；3）智能硬件ODM能力不断扩展，从VR到AR，到智能音箱等一系列产品。

风险提示： 客户拓展不顺；新增订单低于预期。