专栏名称: 丁香园
丁香园官方号,一百多万医生在关注。作为中国医务工作者的网上家园,丁香园深知医疗的痛苦与快乐。我们提供交流的平台、独家深入的内容,也有为医务工作者提供的各种服务。医疗行业从业者,请订阅我们。
目录
相关文章推荐
drpei  ·  可以下单的学习桌椅 ·  昨天  
医脉通临床指南  ·  儿童功能性消化不良,这些诊断标准你都清楚吗? ·  2 天前  
51好读  ›  专栏  ›  丁香园

DeepSeek 会取代医生吗?浙大二院主任医师:它的诊断与临床非常接近

丁香园  · 公众号  · 医学  · 2025-02-17 20:00

主要观点总结

本文介绍了DeepSeek在医疗领域的应用和表现。通过现场测试,DeepSeek在诊断和处理肺结节方面的建议与临床判断接近。但AI在医疗领域的应用仍存在局限性,不能完全取代临床医生。更大型的研究显示,ChatGPT和DeepSeek在医疗领域的表现各有优劣,但DeepSeek的总体准确率略低。医生在使用DeepSeek时更多是通过公开渠道获取资料并进行汇总给出答案,看病是一个个性化的过程,AI不能完全取代临床医生。DeepSeek预测未来医疗流程将部分自动化,但医生岗位总量可能增加,医生将主要处理复杂病例和个性化医疗。

关键观点总结

关键观点1: DeepSeek在医疗领域的应用表现

DeepSeek通过现场测试,在诊断和处理肺结节方面给出与临床判断接近的建议。

关键观点2: AI在医疗领域的局限性

AI在医疗领域的应用仍存在局限性,不能完全取代临床医生,看病是一个个性化的过程。

关键观点3: ChatGPT和DeepSeek的比较

更大型的研究显示,ChatGPT的总体准确率高于DeepSeek。但在某些案例中,DeepSeek的表现稍优。

关键观点4: DeepSeek的使用方式和评价

医生使用DeepSeek时更多是通过公开渠道获取资料并进行汇总。社区内医生对DeepSeek的临床诊断进行了点评和分享。

关键观点5: DeepSeek对未来医疗行业的预测

DeepSeek预测未来医疗流程将部分自动化,医生岗位总量可能增加,医生将主要处理复杂病例和个性化医疗。


正文

DeepSeek 看病到底准吗?


最近,浙江大学医学院附属第二医院胸外科主任医师范军强做了一场现场测试。



「48 岁男性患者,右上肺结节,8 毫米大小磨玻璃结节,已随访观察半年无明显变化,请问诊断是什么?下一步怎么治疗?」


面对范军强教授的提问,DeepSeek 给出的回答如下。


上下滑动查看全文

对于 48 岁男性患者右上肺 8 毫米磨玻璃结节(GGN)随访半年无变化的情况,诊断及处理建议如下:


### **诊断考虑**

1. **良性病变**

- **感染/炎症**:如局灶性肺炎、结核或真菌感染(部分炎症性结节可长期稳定)。

- **纤维化/瘢痕**:陈旧性病变可能表现为稳定 GGN。

- **出血**:少量出血吸收后残留的良性改变。


2. **恶性或癌前病变**

- **原位腺癌(AIS)**或**微浸润腺癌(MIA)**:惰性生长,可能长时间保持稳定。

- **不典型腺瘤样增生(AAH)**:癌前病变,通常生长缓慢。


---


### **下一步处理建议**

根据**Fleischner Society 指南**及临床实践:


1. **继续影像学随访**

- **推荐间隔**:每 6~12 个月复查胸部高分辨率 CT(HRCT),持续至少 2~3 年。

- **关注变化**:大小增加、实性成分出现(部分实性结节恶性风险更高)或形态改变(分叶、毛刺)。


2. **风险评估补充**

- **危险因素**:询问吸烟史、肺癌家族史、职业暴露(如石棉)、是否伴咳嗽/咯血/体重减轻。

- **增强检查**:若存在高危因素或随访中出现进展,可行 PET-CT(评估代谢活性,但纯 GGN 可能假阴性)或穿刺活检(技术难度较高)。


3. **手术干预指征**

- **以下情况建议胸外科会诊**:

- 结节增大或实性成分增加。

- PET-CT 显示高代谢。

- 患者焦虑或强烈要求明确诊断。

- **术式选择**:胸腔镜亚肺叶切除(楔形切除或段切)为主,术中冰冻病理指导范围。


4. **替代策略**

- 若患者拒绝手术或无法耐受,可考虑 CT 引导下穿刺活检(适用于位置表浅的结节)。


---


### **关键提示**

- **纯磨玻璃结节(无实性成分)**:恶性概率约 10~50%,但生长缓慢,5 年生存率接近 100%(若为 AIS/MIA)。

- **随访安全性**:研究表明,持续稳定的 GGN(>2 年)恶性风险较低,但仍需个体化评估。


---


### **总结**

当前建议继续 CT 随访(6~12 个月一次),密切监测变化,同时结合患者风险因素及心理状态决策。若随访中出现进展或恶性特征,及时转胸外科手术。


在测试中,DeepSeek 的回答可圈可点,如引用权威指南、对提问者不够明确的信息进行追问等, 总体来说与临床判断非常接近。


不过,试验中也发现,DeepSeek 给出的部分临床建议也存在不足,如太过笼统、没有必要等。


那么,AI 真的要取代临床医生了吗?


实际上,就这个话题,丁香园前段时间刚刚「举办」了一场比赛,邀请DeepSeek 对垒 ChatGPT,由主任当裁判,比赛内容就是看病。 (点击查看丁香园往期内容: 《DeepSeek 会让医生失业吗?我们直接安排 ChatGPT 来 PK 看病》


比赛从两方面对 AI 的看病能力进行评估:


● 医学专业性审核说明:隐去医生和患者姓名等信息后,平台邀请 2 位及以上临床一线专家进行交叉审核,最终综合所有专家意见得出结果。

● 服务性审核说明:隐去医生和患者姓名等信息后,由具有医学背景的平台工作人员对回复的合规性、完整性和文字表达进行评估。


总的来说,ChatGPT 和 DeepSeek 在看病这件事上半斤八两,都不咋地! 非要排个先后的话,在我们所选取的这 1 个案例中,DeepSeek 稍稍胜上一筹。


图片

比赛结果

更大型的研究显示,在 ChatGPT 和 DeepSeek 分别刷了 500 道医学题后。 ChatGPT 的总体准确率为 92.8%,优于 DeepSeek 的 87.0%。







请到「今天看啥」查看全文