专栏名称: AI与医学
分享前沿的人工智能与医学交叉研究,提供医疗科研服务。关注大壮,科研顺畅。做医护人员科研的小助手,为您全心全意服务。
目录
相关文章推荐
51好读  ›  专栏  ›  AI与医学

病理小白进阶-1:病理科常见开源神器,轻松玩转数字病理分析

AI与医学  · 公众号  ·  · 2025-02-27 13:33

正文

请到「今天看啥」查看全文



点击👆蓝字或👇名片,关注'AI与医学'




前言

数字病理+AI如何落地?无论是癌症检测、组织分割,还是全切片图像分析,这些免费开源工具助你高效搞定!无需从零造轮子,附GitHub链接+实战建议,科研/临床都能用!

如果需求联系大壮,微信:BigStrong-AI

虽然有很多开源算法和教程,但很多人都卡在配置环境的第一步

大壮的AutoMed集成绝大多病理算法百宝箱,可以支持快速的算法实验,让算法实验更简单一些。
01
为什么需要开源病理算法?



数据量大
一张病理切片=数万像素,传统方法效率低❌
标注成本高
医生手动标注耗时,弱监督学习成刚需✅
跨学科协作
算法+病理知识结合,开源社区加速创新🚀

02

常见开源工具库推荐




1. QuPath:小白友好的病理分析神器

  • 功能
    拖拽式标注、细胞计数、免疫组化评分
  • 亮点
    支持Python脚本扩展,临床医生也能快速上手!
  • 官网
https://qupath.github.io

2. TIAToolbox:顶刊论文同款工具包
  • 功能
    组织分割、预后预测、预训练模型一键调用
  • 亮点
    由英国癌症研究中心背书,代码文档超详细!
  • 适用
    科研团队快速复现SOTA模型

  • 官网
https://tia-toolbox.readthedocs.io/en/latest/readme.html


03

常见深度学习模型/框架




1、HoVer-Net:细胞核分割天花板
  • 任务
    同时分割+分类细胞核,癌症分级精准度UP!
  • 论文
    MICCAI 2019顶会认证

HoVer-Net是一种用于多组织显微图像中细胞核 实例分割和分类 的多分支网络模型。它通过利用 细胞核像素的水平和垂直距离来区分聚集的细胞 ,并使用专门的上采样分支对每个分割实例进行核类型的分类。该模型在多个公开数据集上展现出优异的分割和分类性能,适用于不同类型的组织病理图像。


  • 特点和优势

  • 同时分割与分类:

在单个网络中完成细胞核的实例分割和类型分类,提高了效率。

  • 有效处理聚集细胞:

通过预测水平和垂直距离图,能够更好地分离密集聚集的细胞核。

  • 适用于多种组织类型:

经过在多组织数据集上的训练,可以应用于不同类型的组织病理图像。

  • 高精度:

在多个公开数据集上展现出优异的分割和分类性能。

  • 可扩展性:

支持处理单个图像tile和全幻灯片图像(WSI)。


  • github代码

https://github.com/vqdang/hover_net




2. CLAM:弱监督学习黑科技

做病理的哥们们可能都知道这个CLAM了,一个很经典的开开源框架,项目一直更新,最近都支持了病理大模型( UNI CONCH )的特征提取了。

  • 任务
    仅需切片级标签,自动定位病变区域
  • 场景
    胃癌/乳腺癌亚型分类,缓解标注压力


CLAM(Clustering-constrained Attention Multiple Instance Learning)是一种基于深度学习的弱监督学习方法,主要用于全幻灯片图像(Whole Slide Image, WSI)的分析和分类。


  • 工作原理

  1. 自动分割 :CLAM首先对全幻灯片图像进行 自动分割 ,识别出组织区域。这通常涉及到将图像转换到HSV颜色空间,并使用饱和度通道进行阈值处理,以提取组织区域。

  2. 特征提取 :在分割之后,CLAM利用深度卷积神经网络(如ResNet50)为每个分割出的补丁计算 低维特征表示

  3. 注意力机制 :CLAM使用注意力机制来确定每个补丁对最终切片级预测的贡献程度。这涉及到计算每个补丁的不归一化注意力分数,并将其转换为百分位数分数,然后缩放到0到1.0之间。

  4. 实例级聚类 :CLAM使用 实例级聚类来约束和优化特征空间 。具体来说,CLAM模型有多个并行的注意力分支,每个分支计算一个独特的切片级表示,该表示由网络视为多类诊断任务中某一类的强阳性证据的高度关注区域确定。

  5. 分类预测 :每个类别特定的切片表示被分类层检查,以获得整个切片的最终概率分数预测。


  • 优势

  1. 数据高效 :CLAM只需要切片级标签,不需要像素级或补丁级注释,这使得它能够在训练数据有限的情况下取得良好的性能。

  2. 可解释性 :通过注意力机制,CLAM能够识别出对最终预测贡献最大的区域,从而提供了一定程度的可解释性。

  3. 高通量 :CLAM能够处理大规模的全幻灯片图像数据,适用于高通量的病理分析。




04

开源数据集




1.TCGA数据库
30+癌症类型WSI公开数据,训练模型必备

2.Camelyon挑战赛模型
淋巴结转移检测基线方案


05

开发者选型指南




临床医生
从QuPath开始,可视化操作零代码!

算法新手
使用CLAM练练手

进阶研究
CLAM+HoVer-Net组合拳,发Paper利器!


⚠️ 避坑提醒

  1. 数据合规
    患者隐私数据需脱敏处理
  2. 硬件要求
    WSI分析需要GPU+大内存
  3. 模型解释性
    医疗AI需可解释,避免黑箱风险

06

壮心得体会



让医生学习编程和算法是很不合理的,工作那么累,哪有时间学习编程。就连大壮自己调试开源代码,看多了也脑袋疼。

大壮AutoMed目前逐渐集成病理开源代码,做成一个百宝箱,可以启动、管理、训练、优化各种开源代码方案,再多的实验也不会乱了。




排版: 小黄 编辑: 大壮 审稿: 大壮

注:本文仅用于分享相关 学术论文研究,如存在侵权,请告知,及时删




往期推文

论文速读:Artif Intell Med 多模态深度学习改善儿科低级别胶质瘤的复发风险预测

顶刊速读:《Radiology》大规模验证GPT-4作为头部CT报告校对工具的可行性

顶刊速读&大模型:《THE LANCET Digital Health》 GPT-4能读懂医疗笔记了?

顶刊速读:《Nat Med》瘫痪患者用脑机接口控制飞行器游戏

顶刊速看:Nature Med 基于AI和超声的卵巢癌检测:一项国际多中心研究

顶刊速看:IF=9.4 基于影像组学的体成分分析在肝细胞癌患者1年生存预后中的作用

香港理工:EyeGPT—眼科专属大模型

顶刊速读:《Brain》 抑郁症的大尺度病变症状映射识别风险和韧性能力大脑区域









请到「今天看啥」查看全文