乔昕介绍,目前市场上有些公司的数据来源是2-3家医院,这实际上是远远不够的,以CT影像为例,现在市场上在用的各种CT机型有上百种,厂家有7、8家。在产品化的过程中,如果仅使用几个机型的数据,或者下载公开数据集的数据来训练模型,即使实验室准确率很高,也很难在实际应用中取得很好的效果。再比如某些公司研发时用的数据是1mm的CT图像,如果一个患者拍的5mm CT图像,这个时候系统识别起来就有困难。
另外,
GE、西门子、飞利浦等公司的大型医疗设备也在不断的更新。而医疗AI公司研发的产品是否可以适应市场上90% 的影像设备,这样的产品进行市场推广的前提。
深睿医疗虽然才刚刚成立,但是其主要团队在成立前就已经从事过医疗AI产品的研发,尤其是肺结节的筛查产品,在公司成立的时候产品,准确率已经很高了,这几个月一直在进行产品化的工作。
在产品化的过程中,深睿医疗遇见了十几次不匹配的问题,为了能够适应更多的使用条件,他们就回过头来从科研的角度,找合作医院、找新的数据、找新的标注、找新的思路,然后把问题克服掉,一路走下来深睿医疗的CEO乔昕感觉产品化的难度一点不比科研的难度小。
目前深睿医疗的肺结节产品已经克服了各个医院数据不统一,标准不统一的问题,产品可以在医院使用。
另外,乔昕补充说,
他们最初的产品定位是给基层医疗机构提供服务的,基层医疗机构拍摄出来的影像与三甲医院比起来要复杂的多,质量、标准化等差距非常大,但是基层医疗是最大的市场,要想拿下这个市场就必须需要客服这些问题。
这个过程中就需要团队有很深的临床功底,对基础医疗以及各个医院的情况有很深的了解,这样才能做的到。
为了保证数据标注的质量,在系统训练前,数据会交由至少两位以上的资深医学专家进行标注,如果标注结果不一样,深睿医疗会聘请一位更高资历的专家来确定标准,这样确保用于训练的数据是可信的。虽然这样做成本会更加,但是这也确保了系统的准确性。
经过半年多的努力,深睿医疗目前的肺结节早期筛查产品,
已经进入10多家医院,辅助医生完成了大概5000多例诊断。系统总的敏感性和特异性分别为98.6%、92.9%(此数据是通过科学实验针对真实复杂病例得到,此项成果已经在北美放射学年会上发表)。
乔昕强调目前深睿医疗没有去追求使用的数量而是追求普适性,他们在尽量用各种各样的临床数据来验证他们的产品。