近年来,国内外巨头相继进入语音交互领域。
Intel与科大讯飞宣布合作共同研发AI芯片,该芯片将麦克风阵列、远场语音识别等功能集成到SOC当中,形成完整的远场语音交互链条;
今年2月,百度宣布全资收购渡鸦科技,百度集团总裁和首席运营官陆奇指出,凭借语音与对话技术的优势,百度在引领新一代人机交互平台上将拥有巨大机会,自然语言和其他智能交互方式有可能出现在从手机到家居的每一个设备中;
随着亚马逊的智能音箱Echo销量逼近千万,Alexa成为全球范围内截至目前最为成功的消费级AI产品……
需求容易把人抛,火了Echo,满了钱包。
关于消费级语音交互系统,亚马逊Alexa负责人 Toni Reid认为,语音是最简单、最自然的交互方式,也是人类沟通最基本的方式。
而远场语音交互是市场的痛点。
以Siri为代表的近场语音识别要求必须是低噪声、无混响、距离声源很近的场景。
比如用户总是要对着手机讲话才能获得符合近场语音识别要求的声音信号,同时还要求用户满足标准发音,其识别率才有可能达到95%以上。
但是,若声源距离较远,并且真实环境存在大量的噪声、多径反射和混响,导致拾取信号的质量下降,这就会严重影响语音识别率。
远场语音交互技术正在逐步成熟,Amazon通过Echo已经证明了远场语音交互已经迈过用户可接受的门槛,而国内的科大讯飞和声智科技也在发力这个领域。
SO,本期讲习班邀请到声智科技CTO冯大航,将从语音信号处理,麦克风阵列信号处理,语音识别中的关键技术及实用技巧来讲解远场语音交互技术。
你将学到:
三大知识模块,深入了解AI设备语音交互关键技术
理论+实战,了解VOIP的核心技术及其应用
资深专家授课,掌握远场语音识别系统如何搭建
实例解析,对Echo音响拆解及技术进行剖析
还有超值福利,价值1999元的开发板放送!提升实战开发能力!相信专业的你不会错过的~
讲师介绍:
冯大航,声智科技CTO
2007年开始从事语音信号处理,麦克风阵列信号处理,语音识别方向研究,在语音交互领域已经积累10年经验;
2007年毕业于中国科学技术大学电子信息工程系,进入中国科学院声学研究所读博士;
2012年毕业于中国科学院声学研究所,博士期间在阵列信号处理方向发表多篇SCI、EI论文;
2012年获得中国科学院院长奖学金,曾获得国家自然科学基金项目,同时参与了多个国家重大项目;
2015年曾任职于云知声负责远场语音识别前端算法,2016年5月联合创建了声智科技。
课程内容:
一、语音交互概述
1、语音交互行业发展未来趋势
2、麦克风介绍
3、Echo音响拆解及技术剖析
二、让智能设备听得清:麦克风阵列信号处理
1、回声消除技术
2、波达方向估计技术
3、波束形成技术
4、单通道语音增强技术
5、去混响技术
6、各个技术之间的联系
三、让设备听得懂:语音识别技术
1、语音识别基础
2、语音识别原理
3、搭建语音识别系统一般流程
4、远场语音识别声学模型匹配
学员福利:
1、GPU服务
提供长达1个月的GPU服务,快速提升学员的实战开发能力
2、价值1999元的开发板放送
抽取10名积极学员,每人提供一套价值1999元的SAI_MICA_41T-UI、USB版本的开发版,增强实操练习,有效提高学习效率
3、优秀学员内推AI企业
优秀学员可内推BAT和AI企业,跳过层层审核,直达管理层
4、进入学员群,获免费参与活动福利
不定期邀请大牛进行线上/线下的分享,进入一线语音公司面对面交流
课程信息:
5月17日课程上线,上线后可随时观看
开课时长:20+课时,课程上线后,至少两次直播答疑
早鸟票:1499元(5月10日前)
优惠价:1699元
团购价:1399元(三人成团)
如何报名:
1、长按扫描上方二维码即可报名
2、点击左下角“阅读原文”报名
3、若有疑问,搜索微信号“moocmm”,添加AI慕课学院的机器人小慕询问,有任何疑问都可以随时调戏~
或拨打官方咨询电话15210889238(咨询时间:工作日 9:30 - 18:30)
欢迎大家前来进行咨询和报名参加课程~
也欢迎关注我们的服务号哦~^_^