用深度学习技术分析医学影像和视频是一个新的研究方向。通过已训练好的卷积神经网络,能很快地搭建并训练自己的深度学习系统。 本文介绍了微软的一个比赛队伍参加 2017 年 Kaggle 肺癌 CT 图像检测比赛,成功地借用现成的 152 层 ResNet 网络,对接到分布式计算的神经网络上,在 60 分钟内完成训练。并获得了 2017 年 Kaggle 数据科学比赛里很好的名次。
该系统证明了在预先训练好的模型基础上(ImageNet ResNet-152) 进行修改,用自己的数据继续更新权重,快速完成适合自己独特场景 (肺癌检测)的可能性。同时,有具体实施细节和代码可供大家参考,来搭建自己的由 CNTK,LightBGM,ResNet 和 GPU 组成的深度学习系统。本文对卷积神经网络、提升树等技术的基本概念也进行了讲解,希望对刚接触 AI 的朋友有所帮助。
我们先从 DICOM 医学影像格式起,讲讲如何使用医疗影像数据,再介绍卷积神经网络(CNN)的基本概念和过程,最后讲讲前面提到的 2017 年 Kaggle 比赛里用 CT 图像检测肺癌的过程,如何用 Resnet-152、LightGBM 在 Azure GPU 虚机上,60 分钟内完成肺癌检测模型训练和结果提交。
用于图像处理的库有很多,其中 OpenCV(Open computer vision) 比较主流,有强大的社区支持,并支持 C++,JAVA 和 python。
安装时,既可以用 pip install opencv-python,也可以从 opencv.org 下载源码。
如果习惯用 Jupyter notebook 这种开源在线笔记的话,可以先打开 Jupyter,导入 cv2。要安装 numpy 和 matplotlib,以便在 Jupyter 里查看绘制的图形。
import numpy as np;
import cv2;
import matplotlib.pyplot as plt
然后在 Jupyter 里打开图像:
# 将彩色图片以灰度加载
img=cv2.imread('/user/img/dsc_0848.jpg')
plt.imshow(img)
plt.show()
用开源的由 Rainer Lienhart 开发的 ada 正面脸部检测工具,可以小试一下脸部识别。Haar 脸部级联检测的更多信息请见这里,也可以参考用 OpenCV 进行图像处理的例子。
医学影像常常以 DICOM 标准进行存储和交换。该标准包括文件格式和通信协议。
文件格式:所有患者医疗图像都用 DICOM 格式保存。该格式包括患者健康隐私信息 PHI(protected health information),比如姓名,性别,和其他与图像相关的数据,如采集该图像的设备和相关治疗信息。医学影像设备创建 DICOM 文件,医生用 DICOM 查看器——用来展示 DICOM 图像,并对图像内容进行读取和诊断的应用程序。
通信协议:用来搜索图像档案库。医学影像应用程序通过 DICOM 协议连到医院网络,并交换信息,主要是 DICOM 图像和小部分患者和治疗信息。更高级的网络命令可以控制和遵循治疗方案,安排治疗时间,汇报状态,和在医生和影像设备之间协调工作。
更多关于 DICOM 标准的内容,可以参见此博客:http://dicomiseasy.blogspot.sg/。
原文链接:
http://mp.weixin.qq.com/s/yuLfq-xWf4nMmdUi5g0mQQ