专栏名称: 大叔快评
肿瘤学临床研究及制药企业研发评述
目录
相关文章推荐
元素和同位素地球化学  ·  《人类简史》人性的底层逻辑及其与文明发展的悖论 ·  昨天  
元素和同位素地球化学  ·  《人类简史》人性的底层逻辑及其与文明发展的悖论 ·  昨天  
国家外汇管理局  ·  李强主持召开国务院常务会议 ... ·  2 天前  
51好读  ›  专栏  ›  大叔快评

DeepSeek助力药企转型:是跟风炒作,还是划时代变革?

大叔快评  · 公众号  ·  · 2025-02-13 14:26

正文

在数字化浪潮席卷全球的今天,药企也纷纷踏上了转型的快车道。然而,在这场技术革命中,选择什么样的AI工具,才能在这场变革中脱颖而出呢?DeepSeek,这个在全球大语言模型领域异军突起的开源模型,打破“闭源模型效果更佳”的传统观念,从成本效益再到医药场景为我们提供可靠的解决方案,以其一系列创新之举引领着药企AI的新风尚。那么,DeepSeek究竟能否成为药企数字化转型的得力助手?让我们一起揭开它的神秘面纱,探索这场变革背后的真相!


01

对药企数字化转型的战略价值,DeepSeek是“工具升级”还是“范式革命”?


在全球大语言模型领域,DeepSeek正带来不可忽视的变革。与GPT-4、LLaMA等通用大模型相比,DeepSeek为开源范式注入了新的活力。当前,调用API(闭源)是主流做法,但存在数据可控性不足等问题,而一些私有化(开源)模型又难以满足复杂业务需求。DeepSeek R1模型却令人眼前一亮,它完全开源,打破了“闭源模型效果必定更佳”的传统观念,让更多开发者和企业能够基于其架构进行定制与优化。


DeepSeek在技术路径上大胆创新,突破了传统AI发展思路。在库调用方面,采用更为底层的PTS编码方式,有效突破了GPU带宽限制,在实现更低成本的同时,显著提升了效率,一跃成为大语言模型领域的焦点,其性能足以对标OpenAI的头部模型,也为企业提供了更具自主性的选择。


DeepSeek的创新核心体现在两大关键模型上。V3作为基础大模型,在工程实现上进行了深度优化,特别是在软件与硬件的协同配合上取得了重大突破,大幅降低了训练和推理成本。在中文语境下,V3的理解与表达能力表现卓越,甚至超越了部分国际知名模型。V3采用的MOE(混合专家模型)架构更为深入,专家数量的增加以及在负载均衡方面的创新研究,使其在处理复杂任务时更加高效且成本更低。基于V3训练而成的R1模型,成功达到了与OpenAIGPT-4类似的效果,为其他厂商开辟了一条全新的技术发展路径。


对于药企数字化转型而言,DeepSeek带来的远不止是技术工具的升级,更是一场深刻的“范式革命”。它促使药企转变传统思维模式,不再单纯依赖西方的AI发展战略,而是探索出一条适合自身的创新之路。DeepSeek为药企在数字化转型过程中,提供了更高效、成本效益更高的解决方案,有望推动整个行业的数字化变革,其影响深远且意义重大。


02

药企如何权衡成本与数据安全、模型可控性,与其他模型相比Deepseek是否能大幅降低成本?


在药企的实际AI应用中,选择开源还是闭源模型,需要综合多方面因素审慎考量。由于不同团队处于AI应用的不同阶段,且业务场景各异,其选择也会有所不同。


在AI探索初期,API调用方式展现出较高的性价比和灵活性。对于商业化团队和医学团队而言,如果数据敏感度较低或来源公开,采用API调用按需付费的模式,既能避免购置私有服务器的高额成本,又能快速满足业务需求。即便数据存在一定敏感性,也可先尝试数据脱敏后再进行API调用,或者借助外部AI算力。当涉及真正核心数据时,再考虑其他更为安全的方式。药企可根据具体业务场景,对不同模型进行测试,选择最适配的方案。


私有化部署开源模型往往成本高昂,以满血版DeepSeek R1模型为例,保守估计每月成本可达9-10万人民币。实际上,多数药企业务场景并不需要R1这样高级别的推理模型,普通传统大模型或文本生成式语言模型便能满足日常需求。因此,通常优先考虑API调用,只有在API调用受限,或者对数据隐私安全有严格要求时,才会考虑结合私有化部署开源小模型。值得一提的是,如果企业内部使用量大且存在高并发情况,DeepSeek满血版基于MOE架构,在推理时激活参数较少,响应速度快,可能在同等并发下降低硬件成本。


最终,药企应根据实际产出效果和业务的投资回报率(ROI)来决定采用何种模型模式。同时,综合考虑自身业务规模、使用场景以及对模型效果的具体要求,谨慎权衡私有化部署DeepSeek的成本。


03

在医药场景中,DeepSeek如何规避“幻觉”问题呢?


DeepSeek R1模型在推理能力上表现出色,尤其在常识问答、方案撰写以及数学解题等任务中表现优异。然而,在某些特定场景下,“幻觉”问题较为突出,特别是在涉及知识查找,或对其不擅长领域知识进行总结时,容易出现生成内容与事实不符的情况。


在医药业务落地场景中,大模型产生“幻觉”的主要原因是对提问所涉及的知识掌握不够精准。作为生成式模型,一旦基础信息存在偏差,就容易顺着错误信息继续编造。为有效规避这一问题,主要有两个解决方向。一是基于医药领域数据进行微调,从根源上提升模型对专业知识的理解与掌握。但此方法存在一定风险,例如数据获取难度较大,微调效果难以完全预测,且可能对模型其他能力产生未知影响。二是采用相对稳定的RAG(检索增强生成)或Graph(知识图谱)技术,将丰富的医药行业知识融入模型。通过这些技术手段,为DeepSeek提供坚实的知识储备,从而显著降低“幻觉”问题的出现概率,使其能够更可靠地应用于医药场景。


04







请到「今天看啥」查看全文