根据世界卫生组织(WHO) 2021 年公布的数据,世界前 10 大死因共计造成 3900 万人死亡,占全球死亡总人数(6800 万)的 57%,
其主要与两大类疾病有关,即心血管疾病(如缺血性心脏病、中风等)和呼吸系统疾病(如肺结核、慢性阻塞性肺病、下呼吸道感染等)。
其中,呼吸系统疾病所导致的咳嗽或呼吸,包含很多关于我们健康状况的信息。例如,临床医生使用类似“喘息”的咳嗽声来诊断百日咳,以及使用临终呼吸来检测急性心血管事件。
那么,在人工智能(AI)时代,我们是否可以利用这一技术从这些声音数据中提取健康信息,进而更好地监测我们的身体状况呢?
来自谷歌、赞比亚传染病研究中心结核病科的研究团队在这一方向迈出了重要一步,他们合作推出了生物声学基础模型 HeAR(Health Acoustic Representations),旨在帮助他们监听人类声音并标记疾病早期迹象。相关研究论文以
“HeAR - Health Acoustic Representations”
为题,已发表在预印本网站 arXiv 上。
据介绍,他们在从多样化且去识别化的数据集中精心挑选的 3 亿个音频数据上训练了 HeAR,还特别使用了大约 1 亿个咳嗽声音来训练这一“咳嗽模型”。
HeAR 能够辨别与健康相关声音中的模式,在广泛任务上的平均排名高于其他模型,且能够跨麦克风泛化。使用 HeAR 训练的模型也以较少的训练数据实现了高性能,这在常常缺乏数据的医疗研究领域是一个关键因素。HeAR 现在可供研究人员使用,从而帮助加速开发具有较少数据、设置和计算要求的定制生物声学模型。
StopTB Partnership 数字健康专家 Zhi Zhen Qin 表示:“像
HeAR 这样的解决方案将使 AI 驱动的声学分析在肺结核筛查和检测方面大有用处,将为最需要的人提供一种可能影响较小、易于获取的工具。
”
未来,研究团队希望通过这项研究,推进在肺结核、胸部、肺和其他疾病领域的诊断工具和监测解决方案的开发,并帮助改善全球社区的健康结果。
如今,印度的呼吸健康公司 Salcit Technologies 基于此开发了一款名为 Swaasa 的产品,使用 AI 分析咳嗽声音并评估肺部健康。该公司正在探索 HeAR 如何帮助扩展其生物声学 AI 模型的功能。