专栏名称: 卢泓言
且慢。且松。且定。戒急。戒紧。戒躁。降伏此心。唯此一事。
目录
相关文章推荐
舰大官人  ·  -20250207065657 ·  昨天  
江苏教育新闻  ·  痛心!他不幸离世,年仅48岁 ·  2 天前  
江苏教育新闻  ·  痛心!他不幸离世,年仅48岁 ·  2 天前  
梅特涅的信徒  ·  困龙翻身与刘秀脱困 ·  3 天前  
51好读  ›  专栏  ›  卢泓言

腾讯:用AI唤醒聋人

卢泓言  · 公众号  · 自媒体  · 2021-03-03 19:36

正文

“行善”二字,可以有无数下手处,比如扶助弱者也是行善。若能帮一个无力无助的弱者改变命运,其能力何其大?其意义何其大?

弱者之所以弱,是因为他们无力发出自己的声音,声音不被听到,就被遗忘。中国有8500万残疾人,但在生活中,我们很少感知到他们的存在,就像很少见到盲道上有盲人行走。而强者之所以强,就是要主动关注到弱者,传播出那些没有被发出来的“声音”。

聋哑群体,就是很难自己发出声音的一个人群。

在2019年定下“科技向善”为愿景的腾讯,也确实在做实事,2020年“天籁行动”发起,面向公益开发者、设备厂商、相关机构,免费开放腾讯多年积累的天籁AI音频技术,给人工耳蜗消除噪音,帮助聋人从“听得见”到“听得清”。

今天3月3号是全球爱耳日,腾讯天籁联合新华社·声在中国、中国听力语言康复研究中心、中国听力医学发展基金会等,推出了线上听力筛查工具。

世卫组织的最新数据,目前全球1/5的人听力受损,超过15亿人,到2050年,预计1/4的人将会听力受损,超过25亿人。在听力损失刚发生时,一般生活只会受到轻微影响,老年人通常对听力变化并不在意。但听力衰退初期,是干预的最佳时机,而此阶段往往被99%的人忽视。

所以大面积的免费的听力筛查,就可以让很多人及时的发现自己的听力问题,及时的扭转。

长按上图识别二维码,测试听力

而不管15亿还是25亿,都只是冰冷的数字,必须讲出来一个真实的故事,切身的走入一个鲜活的生活。

恰好,这里有一个已经把我打动的故事,可以讲出来给大家听听。

时间回到17年前,一个佛山普通家庭的小女孩出生,她叫宋晓婷。

宋晓婷一出生就听不清楚声音,但没人发现。她喜欢跳舞,一岁多就会跟着音箱上的灯光闪烁舞动。

直到两岁,她还不会说话。去医院检查才发现,她是先天失聪。

鼓声成为她和舞蹈世界的连接方式。她听不清楚音乐,只能通过脚尖感觉音乐鼓点的震动,努力记忆动作。有时候,连音乐的震动声都感觉不到,她就在心里默默数拍子,跟上节奏。

尽管如此,却又很快得知一个更艰难的事实:随着晓婷长大,听力将继续衰减,这仅有的鼓声,也将从她的听觉里消失。

2018年,转机出现了。

广东把人工耳蜗纳入社保,晓婷拿到其中一个免费名额。手术一个月后,晓婷的人工耳蜗开机了。她第一次从妈妈翕动的嘴唇里,听到了自己的名字,“你叫宋晓婷”。

戴上耳蜗后的晓婷,第一次自己下楼去超市、过马路、坐公交……一个有声的世界,在她面前徐徐展开。

那一年,晓婷登上了中央电视台少儿春节联欢晚会的舞台。晓婷穿着碧绿长裙,在舞台中央露出了灿烂笑容。

晓婷

戴上人工耳蜗,听见声音,似乎已经改变了这个女孩的命运。她变得自信,未来开始充满无限可能。但事实并非如此。

“我能听到,但我听不懂。”

就像晓婷跟妈妈说的,“听得见”不意味着“听得清”。她听到的声音,仍然与正常人有着很大差距。人工耳蜗传到她耳朵里的声音,大部分都是噪音,没有细节。

你可以想想一个雾气朦胧的澡堂里,一切都是烟雾缭绕的,你看不清、摸不透。这种像被一层布阻隔、无法确定的声音,就是听障人群听到的世界。

2020年,晓婷离开佛山,前往广州念高中。同一年,这个小女孩的命运和一群工程师发生了交汇。

“对我们健全人来说,一直在雾气弥漫的场景里看东西,可以想象多么痛苦。对于听障人士而言,他们一辈子,每天24小时,都被困在了这样的环境里。如果我们的技术能够为他们提供一些帮助,让他们听的更清楚,那真是一件非常有意义的事情。”

因为工作需要,常年和噪声打交道的商世东接触到“听障人群”后,萌生了这个想法。商世东和晓婷,两个陌生人的命运从此联系到一起。

商世东曾是腾讯多媒体实验室音频技术中心高级总监,2020年12月担任腾讯天籁实验室负责人。加入腾讯前,商世东在2010年组建了杜比北京工程团队,任职杜比北京和悉尼工程团队高级总监9年。加入腾讯后,带领音频团队,负责音频的框架设计和开发工作,支持腾讯内多个实时音视频产品,比如腾讯会议。

商世东的职业生涯目睹了音频技术迭代的历史。“科技可以改善生活 ,也可以弥补缺陷”,这一次,他将目光投向了听障人士。

“公开资料显示中国有8500多万残疾人,但在生活中,你很少感知到他们的存在,就像你很少见到盲道上有盲人行走”,商世东认为,“这是因为我们的‘无障碍建设’做得还不够好”。

萌生了这个想法后,商世东和团队针对听障人群做了大量调研,也分析了国内外很多关于降噪技术在听障方面的应用的研究,发现“噪声”确实是困扰听障人群的一大障碍。

商世东找到了国内人工耳蜗厂商诺尔康,所谓人工耳蜗,就是一个电子装置,把声音信号变成电信号,电信号经过计算机编程,告诉它怎么刺激神经,人就可以产生听觉。

商世东

双方一拍即合,决定研发由AI降噪技术加持的新一代的人工耳蜗,也就是把噪音自动过滤掉,让人直接听见清晰的有意义的声音。

晓婷,成为了新一代人工耳蜗的早期试用者。

“她非常兴奋,整个人的状态非常好,她本就是一个活泼的小姑娘。”商世东回忆起看到晓婷戴上新一代人工耳蜗之后的场景。

用上AI降噪技术之后,晓婷不仅能够听清鸟叫、风声、甚至能透过嘈杂的环境声听到妈妈的声音。这时她的眼睛就发亮了,从一个世界到了另外一个世界。

过去,晓婷只能粗略地分辨男女声,听到妈妈的声音像是“老人家说话的沙哑的声音”;刚戴上新耳蜗,她对妈妈说:你的声音原来更尖细,和爸爸不一样。

一次,妈妈骑着摩托车送晓婷上课,风声吹过,女儿拍了拍她的后背,“妈妈,你的手机响了”。妈妈当时差点哭出来,这几乎是这些年来最幸福的时刻。

AI降噪技术,唤醒了晓婷沉睡的耳朵,细腻鲜活的声音细节涌入了她的世界。她说,“好像施展了魔法,我耳中的噪音被猎人带走了。”

当然,施展魔法的噪音猎人,其研发并不顺利。

消除噪音一直是一个难题。电话早在一百多年前就发明了,但是人类却一直没有解决通话噪音的问题。放眼人类一百多年的语音通话史,也是一段对抗噪音的历史。

比如在嘈杂的菜市场,之所以我们能清晰地听到对面菜贩子的说话,是因为耳朵选择性屏蔽了比如剁肉、吆喝等等的嘈杂声。而商世东团队要做的,就是让机器设备也能像人一样。

想要消除噪音,就需要识别噪音,再主动干预。这个看似简单的方法困扰了技术人员上百年,因为其难点在于识别哪些是噪音。声音处理是最难的,声音数据是一维、图像是二维、视频是三维,维度越少难度越高。

幸运的是,有了AI的加持。商世东团队在菜市场、在办公室、在马路上,在一切存在噪音的地方采集了海量的声音数据,做裁剪和清洗、提取特征,再加入模型训练,如果模型准确率达不到99%,就持续收集,一直做到标准为止。

目前,基于机器学习的AI降噪模型,商世东团队将识别率提升到了96.2%,超过了大多数开源模型。







请到「今天看啥」查看全文