专栏名称: 卢泓言

且慢。且松。且定。戒急。戒紧。戒躁。降伏此心。唯此一事。

腾讯：用AI唤醒聋人

卢泓言 · 公众号 · 自媒体 · 2021-03-03 19:36

正文

“行善”二字，可以有无数下手处，比如扶助弱者也是行善。若能帮一个无力无助的弱者改变命运，其能力何其大？其意义何其大？

弱者之所以弱，是因为他们无力发出自己的声音，声音不被听到，就被遗忘。中国有8500万残疾人，但在生活中，我们很少感知到他们的存在，就像很少见到盲道上有盲人行走。而强者之所以强，就是要主动关注到弱者，传播出那些没有被发出来的“声音”。

聋哑群体，就是很难自己发出声音的一个人群。

在2019年定下“科技向善”为愿景的腾讯，也确实在做实事，2020年“天籁行动”发起，面向公益开发者、设备厂商、相关机构，免费开放腾讯多年积累的天籁AI音频技术，给人工耳蜗消除噪音，帮助聋人从“听得见”到“听得清”。

今天3月3号是全球爱耳日，腾讯天籁联合新华社·声在中国、中国听力语言康复研究中心、中国听力医学发展基金会等，推出了线上听力筛查工具。

世卫组织的最新数据，目前全球1/5的人听力受损，超过15亿人，到2050年，预计1/4的人将会听力受损，超过25亿人。在听力损失刚发生时，一般生活只会受到轻微影响，老年人通常对听力变化并不在意。但听力衰退初期，是干预的最佳时机，而此阶段往往被99%的人忽视。

所以大面积的免费的听力筛查，就可以让很多人及时的发现自己的听力问题，及时的扭转。

长按上图识别二维码，测试听力

而不管15亿还是25亿，都只是冰冷的数字，必须讲出来一个真实的故事，切身的走入一个鲜活的生活。

恰好，这里有一个已经把我打动的故事，可以讲出来给大家听听。

时间回到17年前，一个佛山普通家庭的小女孩出生，她叫宋晓婷。

宋晓婷一出生就听不清楚声音，但没人发现。她喜欢跳舞，一岁多就会跟着音箱上的灯光闪烁舞动。

直到两岁，她还不会说话。去医院检查才发现，她是先天失聪。

鼓声成为她和舞蹈世界的连接方式。她听不清楚音乐，只能通过脚尖感觉音乐鼓点的震动，努力记忆动作。有时候，连音乐的震动声都感觉不到，她就在心里默默数拍子，跟上节奏。

尽管如此，却又很快得知一个更艰难的事实：随着晓婷长大，听力将继续衰减，这仅有的鼓声，也将从她的听觉里消失。

2018年，转机出现了。

广东把人工耳蜗纳入社保，晓婷拿到其中一个免费名额。手术一个月后，晓婷的人工耳蜗开机了。她第一次从妈妈翕动的嘴唇里，听到了自己的名字，“你叫宋晓婷”。

戴上耳蜗后的晓婷，第一次自己下楼去超市、过马路、坐公交……一个有声的世界，在她面前徐徐展开。

那一年，晓婷登上了中央电视台少儿春节联欢晚会的舞台。晓婷穿着碧绿长裙，在舞台中央露出了灿烂笑容。

晓婷

戴上人工耳蜗，听见声音，似乎已经改变了这个女孩的命运。她变得自信，未来开始充满无限可能。但事实并非如此。

“我能听到，但我听不懂。”

就像晓婷跟妈妈说的，“听得见”不意味着“听得清”。她听到的声音，仍然与正常人有着很大差距。人工耳蜗传到她耳朵里的声音，大部分都是噪音，没有细节。

你可以想想一个雾气朦胧的澡堂里，一切都是烟雾缭绕的，你看不清、摸不透。这种像被一层布阻隔、无法确定的声音，就是听障人群听到的世界。

2020年，晓婷离开佛山，前往广州念高中。同一年，这个小女孩的命运和一群工程师发生了交汇。

“对我们健全人来说，一直在雾气弥漫的场景里看东西，可以想象多么痛苦。对于听障人士而言，他们一辈子，每天24小时，都被困在了这样的环境里。如果我们的技术能够为他们提供一些帮助，让他们听的更清楚，那真是一件非常有意义的事情。”

因为工作需要，常年和噪声打交道的商世东接触到“听障人群”后，萌生了这个想法。商世东和晓婷，两个陌生人的命运从此联系到一起。

商世东曾是腾讯多媒体实验室音频技术中心高级总监，2020年12月担任腾讯天籁实验室负责人。加入腾讯前，商世东在2010年组建了杜比北京工程团队，任职杜比北京和悉尼工程团队高级总监9年。加入腾讯后，带领音频团队，负责音频的框架设计和开发工作，支持腾讯内多个实时音视频产品，比如腾讯会议。

商世东的职业生涯目睹了音频技术迭代的历史。“科技可以改善生活，也可以弥补缺陷”，这一次，他将目光投向了听障人士。

“公开资料显示中国有8500多万残疾人，但在生活中，你很少感知到他们的存在，就像你很少见到盲道上有盲人行走”，商世东认为，“这是因为我们的‘无障碍建设’做得还不够好”。

萌生了这个想法后，商世东和团队针对听障人群做了大量调研，也分析了国内外很多关于降噪技术在听障方面的应用的研究，发现“噪声”确实是困扰听障人群的一大障碍。

商世东找到了国内人工耳蜗厂商诺尔康，所谓人工耳蜗，就是一个电子装置，把声音信号变成电信号，电信号经过计算机编程，告诉它怎么刺激神经，人就可以产生听觉。

商世东

双方一拍即合，决定研发由AI降噪技术加持的新一代的人工耳蜗，也就是把噪音自动过滤掉，让人直接听见清晰的有意义的声音。

晓婷，成为了新一代人工耳蜗的早期试用者。

“她非常兴奋，整个人的状态非常好，她本就是一个活泼的小姑娘。”商世东回忆起看到晓婷戴上新一代人工耳蜗之后的场景。

用上AI降噪技术之后，晓婷不仅能够听清鸟叫、风声、甚至能透过嘈杂的环境声听到妈妈的声音。这时她的眼睛就发亮了，从一个世界到了另外一个世界。

过去，晓婷只能粗略地分辨男女声，听到妈妈的声音像是“老人家说话的沙哑的声音”；刚戴上新耳蜗，她对妈妈说：你的声音原来更尖细，和爸爸不一样。

一次，妈妈骑着摩托车送晓婷上课，风声吹过，女儿拍了拍她的后背，“妈妈，你的手机响了”。妈妈当时差点哭出来，这几乎是这些年来最幸福的时刻。

AI降噪技术，唤醒了晓婷沉睡的耳朵，细腻鲜活的声音细节涌入了她的世界。她说，“好像施展了魔法，我耳中的噪音被猎人带走了。”

当然，施展魔法的噪音猎人，其研发并不顺利。

消除噪音一直是一个难题。电话早在一百多年前就发明了，但是人类却一直没有解决通话噪音的问题。放眼人类一百多年的语音通话史，也是一段对抗噪音的历史。

比如在嘈杂的菜市场，之所以我们能清晰地听到对面菜贩子的说话，是因为耳朵选择性屏蔽了比如剁肉、吆喝等等的嘈杂声。而商世东团队要做的，就是让机器设备也能像人一样。

想要消除噪音，就需要识别噪音，再主动干预。这个看似简单的方法困扰了技术人员上百年，因为其难点在于识别哪些是噪音。声音处理是最难的，声音数据是一维、图像是二维、视频是三维，维度越少难度越高。

幸运的是，有了AI的加持。商世东团队在菜市场、在办公室、在马路上，在一切存在噪音的地方采集了海量的声音数据，做裁剪和清洗、提取特征，再加入模型训练，如果模型准确率达不到99%，就持续收集，一直做到标准为止。

目前，基于机器学习的AI降噪模型，商世东团队将识别率提升到了96.2%，超过了大多数开源模型。

腾讯：用AI唤醒聋人

正文

请到「今天看啥」查看全文