专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
爱可可-爱生活  ·  【Olah:自托管的轻量Huggingfac ... ·  2 天前  
爱可可-爱生活  ·  [AS]《ETTA: ... ·  2 天前  
爱可可-爱生活  ·  本文提出了一个用于训练语言Agent解决复杂 ... ·  2 天前  
黄建同学  ·  强力推荐!PDF中英文翻译神器PDFMath ... ·  4 天前  
51好读  ›  专栏  ›  机器学习研究会

【干货】一篇文章掌握Kaggle竞赛中的基于ResNet和Azure GPU加速的肺癌CT图像识别

机器学习研究会  · 公众号  · AI  · 2017-05-06 18:27

正文



点击上方“机器学习研究会”可以订阅哦
摘要
 

转自:大数据杂谈

用深度学习技术分析医学影像和视频是一个新的研究方向。通过已训练好的卷积神经网络,能很快地搭建并训练自己的深度学习系统。 本文介绍了微软的一个比赛队伍参加 2017 年 Kaggle 肺癌 CT 图像检测比赛,成功地借用现成的 152 层 ResNet 网络,对接到分布式计算的神经网络上,在 60 分钟内完成训练。并获得了 2017 年 Kaggle 数据科学比赛里很好的名次。


该系统证明了在预先训练好的模型基础上(ImageNet ResNet-152) 进行修改,用自己的数据继续更新权重,快速完成适合自己独特场景 (肺癌检测)的可能性。同时,有具体实施细节和代码可供大家参考,来搭建自己的由 CNTK,LightBGM,ResNet 和 GPU 组成的深度学习系统。本文对卷积神经网络、提升树等技术的基本概念也进行了讲解,希望对刚接触 AI 的朋友有所帮助。


我们先从 DICOM 医学影像格式起,讲讲如何使用医疗影像数据,再介绍卷积神经网络(CNN)的基本概念和过程,最后讲讲前面提到的 2017 年 Kaggle 比赛里用 CT 图像检测肺癌的过程,如何用 Resnet-152、LightGBM 在 Azure GPU 虚机上,60 分钟内完成肺癌检测模型训练和结果提交。



用 Python 进行图像处理的基础  


用于图像处理的库有很多,其中 OpenCV(Open computer vision) 比较主流,有强大的社区支持,并支持 C++,JAVA 和 python。

安装时,既可以用 pip install opencv-python,也可以从 opencv.org 下载源码。

如果习惯用 Jupyter notebook 这种开源在线笔记的话,可以先打开 Jupyter,导入 cv2。要安装 numpy 和 matplotlib,以便在 Jupyter 里查看绘制的图形。

import numpy as np;
import cv2;
import matplotlib.pyplot as plt

然后在 Jupyter 里打开图像:

# 将彩色图片以灰度加载
img=cv2.imread('/user/img/dsc_0848.jpg')
plt.imshow(img)
plt.show()


   
 基本脸部识别


用开源的由 Rainer Lienhart 开发的 ada 正面脸部检测工具,可以小试一下脸部识别。Haar 脸部级联检测的更多信息请见这里,也可以参考用 OpenCV 进行图像处理的例子。



医学影像数据格式  


医学影像常常以 DICOM 标准进行存储和交换。该标准包括文件格式和通信协议。

  • 文件格式:所有患者医疗图像都用 DICOM 格式保存。该格式包括患者健康隐私信息 PHI(protected health information),比如姓名,性别,和其他与图像相关的数据,如采集该图像的设备和相关治疗信息。医学影像设备创建 DICOM 文件,医生用 DICOM 查看器——用来展示 DICOM 图像,并对图像内容进行读取和诊断的应用程序。

  • 通信协议:用来搜索图像档案库。医学影像应用程序通过 DICOM 协议连到医院网络,并交换信息,主要是 DICOM 图像和小部分患者和治疗信息。更高级的网络命令可以控制和遵循治疗方案,安排治疗时间,汇报状态,和在医生和影像设备之间协调工作。


更多关于 DICOM 标准的内容,可以参见此博客:http://dicomiseasy.blogspot.sg/。


原文链接:

http://mp.weixin.qq.com/s/yuLfq-xWf4nMmdUi5g0mQQ

“完整内容”请点击【阅读原文】
↓↓↓