2018年7月,华为和金域医学正式启动了全面战略合作,其中一项重要内容就是医疗AI在宫颈癌筛查上的应用。
合作方向确定后,金域围绕该项目组建了团队。团队的核心是金域的病理医生,主要负责训练数据集的标注和校验。华为云也同步跟进,投入了一个5、6个人的专家团队,一起进行模型的训练和调优,整个过程持续了近一年。
医工交叉是医疗AI行业的一个普遍难题。为了能够给双方建立一个很好的对话机制,金域医学病理中心主任罗丕福博士给华为云的团队进行了为期一周的培训。
华为云AI相关技术负责人说道,“华为云的团队一开始并没有宫颈细胞病理学的基础,但是AI算法需要把专家的经验固化到模型里,这个工作要怎么做,我们和病理专家进行了长时间的探讨。”
医疗AI的训练需要大量优质的数据。项目带头人、金域医学病理中心主任罗丕福博士说,“我们年检测标本量超过6000万例。截至2018年底,金域宫颈病变检测中心累计收到来自全国31个省市区的宫颈癌筛查样本超过4350万例。”
基于这些样本,金域医学挑选出近20万图像块进行精准标注和AI辅助筛查模型训练,共投入超过30位病理医生参与相关工作,6名高年资医生进行标注,5名细胞病理专家负责审核指导工作。
据雷锋网了解,此次技术开发中挑选进行模型训练和验证的32000例样本涵盖了广东、广西、江苏、山东、四川等多个省份,年龄与地区分布均具有普适性,用于训练的阳性数据最新包括2019年,最早可追溯到2007年。
如果把AI产品的研发比作一次火箭的发射过程,火箭的燃料是数据,那么发射台就是AI开发平台。
华为云推出的一站式AI开发平台ModelArts,从标注、训练模型、图片判断、推理等方面为AI模型的训练和应用提供技术支撑。通过输入病例图像,ModelArts采用半自动化标注的方式对病例图像进行图像分析,进而生成检测报告。
华为云AI相关技术负责人表示,
和其他宫颈细胞学分析平台不同的是,ModelArts提供了一个图像块级别分类的模块,能够优先识别阳性细胞密集的图像块,提高算法运行的效率。
另外,ModelArts也提供了一个细胞级的检测和识别模块,能够准确地定位和识别个别的阳性细胞,提高算法判别的精度。
双方共同的努力也得到了回报。
目前,双方已用超过20000例样本数据的验证集,对该AI模型进行了验证。验证结果表明,该模型的排阴率为61.9%,阴性片判读的准确率高于99%,阳性病变的检出率超过99.9%。