eo记者 潘秋杏
编辑 黄燕华
审核 姜黎
自DeepSeek R1模型发布以来,据不完全统计,截至目前,南方电网、国家电网、国家能源集团、中国华能、国家电投、中国华电、中国大唐、中广核、中核集团、中国石油、中国石化、中国海油、国家管网集团等13家能源央企都官宣接入了DeepSeek大语言模型。北京市社会科学院副研究员王鹏认为,DeepSeek凭借开源低成本、强大的技术实力、适配灵活性与兼容性以及丰富的应用场景等优势,吸引众多企业接入。
过去很长的一段时间,能源央企在数字化、人工智能(AI)领域开展了大量的研究,新一轮AI技术的进步将带动能源行业在AI领域的研发与运用加速。
有AI专家介绍,目前市场上发布的AI大模型与日常生活结合的比较紧密,但能源电力等专业数据不存在于上述大模型中,其生成效果是比较差的。目前,AI在医疗、能源等专业领域还没有巨大的突破,但发展空间和潜力巨大。“未来,能源大模型只可能产生在能源企业内部,不可能产生于目前的互联网公司。”
DeepSeek的接入,可为各企业提供通用服务,如知识问答、文档分析等。国家电投中央研究院人工智能团队完成DeepSeek模型本地化部署,研发科技情报助手并上线试运行,应用成功挂载科技信息知识库,初步实现了问答应用开发。中国华电的“华电睿思”数字底座与DeepSeek的深度融合后,在智能问答和自动分析方面将进一步升级。
DeepSeek也支持在专业垂直场景进行应用。2月11日,国家能源集团信息技术公司(数据中心)完成DeepSeek-R1系列大模型在国能企业云平台本地化部署并正式上线,该模型已与国家能源集团传媒中心有限公司的多媒体平台、北京低碳清洁能源研究院复杂能源市场价格预测大模型等开展深度适配工作。中国核电旗下核电运行研究院开发的核智AI门户接入DeepSeek大模型,依托DeepSeek的强大能力,融合历史运维数据实现故障预判、基于实时数据与AI实现核电站运行状态智能监控与异常预警等。
香港中文大学(深圳)理工学院教授赵俊华介绍,大语言模型的构建大致有预训练、微调和强化学习三个阶段。预训练需要大量的资金、人力的投入,而微调和强化学习的要求相对较低。像DeepSeek这样已经经过预训练的开源模型,其技术进步快于闭源模型,加入行业企业的语料进行微调或者强化学习,可以从较低成本适配企业自身的需求。
在接入DeepSeek前,一些能源企业基于不同的模型底座,开发了行业大模型。2023年9月,南方电网发布电力行业首个行业大模型“大瓦特”;2024年8月,中国石油的昆仑大模型通过了国家生成式人工智能服务备案;2024年10月,中国海油“海能”人工智能模型正式发布;2024年12月,国家电网发布了光明电力大模型。
接入DeepSeek有助于行业模型的升级。中国石化2月5日完成DeepSeek在国产化算力环境上的部署,并接入长城大模型应用系统,在企业内部分批推广使用。中国石化对DeepSeek的测试表明,DeepSeek大模型在识别石油化工行业的数学公式、化学结构式、专业图表等专业内容时,准确率较高,能够有效支撑行业数据集建设和行业模型训练。
2月12日,南方电网“大瓦特”电力大模型体系全面引入开源大模型DeepSeek,完成DeepSeek系列模型适配。引入DeepSeek开源大模型后的南方电网“大瓦特”电力大模型体系,实现自然语言(NLP)基础模型由百亿参数向千亿参数迭代,提供分布式、高并发推理服务,支持灵活匹配不同算力资源环境。
eo梳理发现,在部署模式上,中国石油、国家管网集团、中国海油3家公司明确了私有化部署的模式,国家能源集团、南方电网、国家电投、中国华能、中国大唐、中广核6家公司则明确了本地化部署的模式。国家电网、中国石化、中国海油还强调在国产化算力环境部署。
王鹏认为,本地化部署和私有化部署,由于数据存放在企业内部或私有云端,企业拥有对数据的完全控制权,因此数据安全性和隐私保护程度较高。国产化算力环境部署同样强调数据安全,且通过自主可控的硬件和软件系统,可以进一步降低数据泄露和被窃取的风险。