动态心电图(Holter监测)是一种通过便携式心电图仪在患者日常生活中连续记录心电活动的监测技术。它能够捕捉到常规静态心电图检查中可能遗漏的心律失常、心肌缺血等心脏问题。从最初的便携式记录仪到现代智能化设备,动态心电图在心脏病诊断和管理中发挥着越来越重要的作用。
然而,随着监测技术的普及,海量的心电图数据给医生和技师带来了一定的工作压力,导致心电图(ECG)解读的质量下降,进而可能引发误诊、延迟治疗和不良患者结局。为了解决这一问题,人工智能(AI)技术应运而生。
最近,一项发表在《自然·医学》上的研究显示,AI在分析动态心电图方面表现优异,甚至超过了专业工作人员。该研究测试了一种名为DeepRhythm 的AI模型,以评估其在识别关键心律失常(critical arrhythmias)方面的性能,并与人类技术人员的解读进行比较。研究结果表明,DeepRhythm AI模型在准确性和效率上均优于传统的人工分析,为ECG解读提供了新的解决方案。
1. 数据来源
本研究分析了2016年至2019年间14,606名美国患者的动态心电图数据。使用PocketECG设备(双导联,采样率300次/秒),对患者进行了1至31天的连续监测,总监测时长达21万天。这些患者由1,079名医生从166家诊所转诊,并由167名ECG技术人员使用基于特征的算法逐个分析采集的数据。分析内容包括停搏、心动过缓、房室传导阻滞以及各类心律失常的诊断与标记。
流程图。VT,室性心动过速;AF,房颤;SVT,室上性心动过速;AIVR,加速自主心室节律;IVR,室性心律;EAR,异位心房节律。
2. DeepRhythm AI模型
DeepRhythm AI模型(v3.1)是一种基于卷积神经网络(CNN)和变换器(Transformer)技术的心律分类智能算法,能够高效检测心电图(ECG)中的QRS波群、过滤噪声并对心跳进行分类。其工作流程包括信号处理、心跳检测和心律分类三个步骤。模型通过大量5分钟ECG数据进行预训练,并在短时数据上微调,使用AdamW算法优化性能,旨在提高心律失常检测的效率和准确性,为临床诊断提供可靠支持。
3. 严重与非严重性心律失常
研究通过自动化脚本筛选出5,235条34秒心电图片段,其中2,236条包含严重心律失常(如房颤、室颤、停搏),其余为非严重心律失常(如窦性心律、窦性心动过缓)。
4. 共识小组注释
17个专家小组,每个小组由三名专家注释者组成(≥2名委员会认证的心脏病学家)对心电图片段进行注释,形成黄金标准。专家独立于AI和ECG技术人员,使用自定义软件平台标注,最终通过共识确定结果。
5. 统计学分析
主要分析比较AI模型和ECG技术人员在记录期间,每千名患者严重心律失常的敏感性、特异性、阳性预测值(PPV)、阴性预测值(NPV)和F1分数等。真阳性事件被定义为由AI模型或技术人员检测到的事件,并且根据独立的金标准共识小组注释进行了正确注释。采用Stata进行RR分析,其余分析均使用Python完成。
1. 研究人群
研究人群包括14,606名患者(平均年龄为65.5±10岁,42.8%为男性),平均监测时长为14±10天。最常见的监测指征包括心悸、晕厥、头晕和房颤检查。
2. 严重心律失常
包括≥30秒的心房颤动(AF)、≥30秒的室上性心动过速(SVT)、持续≥3.5秒的窦性停搏/心脏停搏、任何持续时间的三度房室传导阻滞和≥10秒且≥120次每分钟的室性心动过速(VT)。
AI模型在检测严重心律失常方面表现出更高的敏感性,也具有更高的阴性预测值。AI模型在检测严重心律失常时的敏感性为98.6%(95% CI: 97.7–99.4),显著高于技术人员的80.3%(95% CI: 77.3–83.3%)(见表1)。AI模型对严重心律失常的阴性预测值为99.9%(95% CI=99.9–100%),而技术人员为99.1%(95% CI=98.9–99.2),AI模型在所有个别严重心律失常类别中均具有更高的阴性预测值(表1)。
严重心律失常的分类结果显示,AI模型在检测所有严重心律失常方面表现出比技术人员更高的敏感性,但在≥10秒的VT、心脏停搏和三度房室传导阻滞的特异性较低。AI模型在AF和持续SVT的阳性预测值与技术人员相似,但在持续VT、三度房室传导阻滞和心脏停搏的阳性预测值较低。整体F1分数相似,AI模型在持续SVT方面优于技术人员,而ECG技术人员在VT方面表现更好(表1)。
表1:DeepRhythm AI与ECG技术人员在严重心律失常检测中的结果对比(以心脏病专家共识为金标准)
假阴性结果
:AI模型每千名患者发生3.2例假阴性事件,而ECG技术人员为44.3例(图1),技术人员的漏诊相对风险(RR)是AI模型的14.1倍(95% CI: 10.4–19.0)。在整个记录期间,假阴性RR随着监测时间的增加而增加(监测1-2天的RR=7.8(95% CI=3.1–19.8),监测3-7天的RR=9.1(95% CI=3.9–21.1),监测≥8天的RR=17.9(95% CI=11.9–26.9))。
图1. AI和技术人员分析的假阴性严重心律失常(每1000例患者)
真阳性结果
:AI模型对SVT、心脏停搏、三度房室传导阻滞和VT ≥10秒的心律失常中真阳性率显著高于技术人员,并且AI模型检测到的AF事件数量上也更多(见图2)。
图2. AI和ECG技术人员分析的真阳性严重心律失常(每1000例患者)
假阳性结果
:相较于ECG技术人员,AI模型在停搏、三度房室传导阻滞和VT≥10秒的心律失常中假阳性率较高(见图3)。敏感性分析显示,若将严重心律失常之间的误分类不计为假阳性,AI模型的总体假阳性率为6.3%,ECG技术人员为2.3%(扩展图4),AI模型每千名患者的假阳性事件为12例(四分位数范围(IQR)=6-74),技术人员为5例(IQR=2-153)。
图3. AI和ECG技术人员分析的假阳性严重心律失常(每1000例患者)
3. 非严重心律失常
非严重心律失常包括房性早搏、室性早搏、二度房室传导阻滞、2.0–3.5秒的停搏、<10秒的室速、室性自主心律/加速性室性自主心律、<30秒的室上速以及异位房性心律(见表2)。
AI模型在所有非严重心律失常中的敏感度均优于ECG技术人员,且在停搏和室性自主心律中的F1分数更高,但在除<30秒室上速和异位房性心律外的所有非严重心律失常中特异度较低(见表2)。
表2. DeepRhythm AI和ECG技术人员在非严重心律失常检测结果的对比(以心脏病专家共识为金标准)