专栏名称: 广东工信
广东工信
目录
相关文章推荐
51好读  ›  专栏  ›  广东工信

广东省工业和信息化厅 广东省通信管理局关于组织开展算力强基揭榜行动的通知

广东工信  · 公众号  ·  · 2025-02-28 23:11

主要观点总结

本文是关于广东省工业和信息化厅及通信管理局关于组织开展算力强基揭榜行动的通知的概要。该通知旨在贯彻落实相关部署,夯实算力网络发展底座,加快创新技术和产品应用,推动算力网络体系化发展。揭榜任务内容主要涉及计算、存储、网络、应用、绿色、安全等六大重点方向,申报和推荐工作已启动。

关键观点总结

关键观点1: 通知背景

为贯彻落实工业和信息化部办公厅《关于组织开展算力强基揭榜行动的通知》和广东省的相关行动计划,旨在夯实算力网络发展底座,加快创新技术和产品应用。

关键观点2: 揭榜任务内容

面向算力网络的计算、存储、网络、应用、绿色、安全等六大重点方向,发掘一批掌握关键核心技术、具备较强创新能力的企事业单位,突破一批标志性技术产品和方案。

关键观点3: 申报和推荐要求

申报单位需为在中华人民共和国境内注册、具有独立法人资格、具有较强技术创新和产业化应用能力的企事业单位。遵循公开、公平、公正的原则,审核遴选推荐优质项目。省工业和信息化厅及省通信管理局负责相关任务的推荐工作。

关键观点4: 工作程序和时间安排

申报单位通过申报系统进行申报,提交所需材料。省工业和信息化厅、省通信管理局作为推荐单位,将于2025年3月31日前登录系统并确认推荐名单。工业和信息化部组织遴选并公布入围揭榜单位名单,开展测评工作等。

关键观点5: 附带的附件

包括算力强基揭榜单位推荐表、申报材料以及其他相关附件。


正文

点击上方 “广东工信” 关注我们哦!


广东省工业和信息化厅 广东省通信管理局 关于组织开展算力强基揭榜行动的通知

粤工信信软函〔2025〕4号

各地级以上市工业和信息化主管部门,深圳市通信管理局,省(市)基础电信企业,各有关单位(企业):


为贯彻落实工业和信息化部办公厅《关于组织开展算力强基揭榜行动的通知》(工信厅通信函〔2025〕55号)、《广东省算力基础设施高质量发展行动暨“粤算”行动计划(2024-2025年)》(粤通联〔2024〕3号)相关工作要求,夯实算力网络发展底座,加快创新技术和产品应用,推动算力网络“点、链、网、面”体系化发展,现组织各单位积极参与算力强基揭榜行动的申报工作,有关事项通知如下:


揭榜任务内容

面向算力网络的计算、存储、网络、应用、绿色、安全等六大重点方向,发掘一批掌握关键核心技术、具备较强创新能力的企事业单位,突破一批标志性技术产品和方案。


计算方面,攻关智能算力管理、算力加速等技术,提高计算性能与效率;存储方面,研发多介质存储设备管理、跨域存储资 源池协同等技术,实现海量数据可靠与灵活存储;网络方面,突破算内网络与算间网络等技术,促进算力资源高速互联;应用方面,加强算力与行业深度融合,实现多场景便捷用算;绿色方面,研发新型制冷、碳排放感知优化等技术,推动算力设施节能降碳;安全方面,推动智能监测、运维机器人等技术发展,保障算力中心可靠运行。


申报和推荐

(一)申报单位须为在中华人民共和国境内注册、具有独立法人资格、具有较强技术创新和产业化应用能力的企事业单位,其攻关目标或应用场景应与广东省算力产业具有较强关联性。申报单位根据《算力强基揭榜行动任务榜单》(见附件)选择揭榜任务,并需承诺揭榜后能够在指定期限内完成相应任务,每个单位申报不超过3个项目。有关企业、高校、科研机构等以联合体方式申报的,牵头单位为1家,联合参与单位不超过4家。


(二)各地级以上市工业和信息化主管部门和深圳市通信管理局应高度重视,积极组织发动有关单位(企业),按照政府引导、企业自愿的原则申报揭榜。有关单位(企业)应结合自身技术优势积极申报,共同推进算力基础设施高质量发展。


(三)省工业和信息化厅主要负责我省算力强基揭榜行动任务榜单中第二、四、五、八、十三、十五、十六、十七、十八、十九、二十二项任务的推荐工作,省通信管理局主要负责榜单中第一、三、六、七、九、十、十一、十二、十四、二十、二十一项任务的推荐工作,将遵循公开、公平、公正的原则,审核遴选推荐创新能力突出、产业化前景好、行业带动作用明显的项目推荐上报。


工作程序和要求

(一)申报单位通过申报系统(https://gs.hcp.ac.cn)进行申报,完成注册后填写申报所需材料。申报截止时间为2025年3月15日。


(二)省工业和信息化厅、省通信管理局作为推荐单位,于2025年3月31日前登录系统并确认推荐名单。在每个方向推荐项目数量原则上不超过3个,所有方向累计推荐项目总量不超过20个。


(三)工业和信息化部组织遴选并公布入围揭榜单位名单。入围揭榜单位完成攻关任务后(名单公布之日起不超过2年),工业和信息化部委托第三方专业机构开展测评工作,择优确定揭榜优胜单位(每个揭榜方向原则上不超过3家)。省工业和信息化厅、省通信管理局将结合工业和信息化部部署,统筹利用各类资源对揭榜入围、优胜单位予以支持,推动优秀成果示范应用推广。鼓励各地结合实际,对推荐项目在政策、资金、资源配套、推广应用等方面加大扶持力度。


省工业和信息化厅联系人及联系方式:

刘坤东,020-83133375


省通信管理局联系人及联系方式:

梁浩威,020-87626806



附件

算力强基揭榜行动任务榜单



附件

算力强基揭榜行动任务榜单


计算


(一)云边端算网协同管理系统


揭榜任务:

面向云边端多层级算力环境,研发算网协同应用管理系统,设计面向不同应用软件架构的管理机制,支持对不同架构应用软件的统一管理;研发应用软件在算网协 同中的自动化构建部署能力,支持应用软件的自动构建和分发部署;研究算网协同应用系统的一体化观测能力,降低运维复杂度,提高复杂应用软件运行的稳定性和可靠性。


预期目标:

到2026年,研制应用软件管理系统,支持对传统应用软件、云原生应用软件、AI应用软件、大数据应用软件等不少于5种应用软件的全生命周期管理。研究基于算网协同的分布式构建和部署技术,支持上述应用软件的自动分发和跨算力节点部署,实现零人工介入。研发算网应用一体化观测功能,具备白盒化动态分析以及智能故障根因定位能力。在不少于3个行业完成试点验证。


(二)支持超大规模参数模型的训推一体化异构智算平台


揭榜任务:

面向人工智能大模型训练和推理对计算资源的需求,研发支持超大规模参数模型的训练、推理一体化智算平台,包括资源调度策略、训推加速套件等,并可支持多 种硬件架构,屏蔽底层硬件差异,提升超大规模模型在训练、推理过程中稳定性、资源利用率和运行效率。


预期目标:

到2026年,研发一套支持万亿参数模型的超大规模训推一体化智算平台,万卡环境下稳定训练时间不低于30天,有效训练时长不低于95%,训练效率较当前主流水平提升不低于30%,推理效率提升不低于50% 。支持主流深度学习框架,兼容多种硬件架构,并提供统一的编程接口和开发环境,实现不低于10个行业用户的落地验证。


(三)异构算力跨域任务编排系统


揭榜任务:

针对跨域异构算力协同,研发跨域异构算力管理系统,实现跨域异构算力的管理和应用。研发针对多样 性算力的规范化开放互联功能,支持对不同类型的异构算力 模型统一抽象封装;研发跨域异构算力的管理功能,支持对 跨域异构算力的统一管理和协同;研究跨域多主体算力的安 全认证和控制方法,保障跨域协同安全。


预期目标:

到2026年,研发不少于6种跨域协同调度算法,支持数据处理、函数计算、机器学习等不少于3个场景的计算任务部署,完成不少于5个跨域算力中心的统一管理。研发跨域多主体算力的安全认证方法,支持云边端等不同层级算力协同的安全要求。在不少于2个行业完成试点验证。


(四)训推算力一体机


揭榜任务:

面向人工智能训练、推理场景,研发基于基 础设施即服务(IaaS)和平台即服务(PaaS)的高性能训推一体化解决方案,覆盖对大模型开发训练和部署推理的全流程,包括数据准备、模型训练、模型评测和模型部署。同时,支持大模型加密、攻击防御等能力,解决针对大模型数据泄露、指令攻击等安全问题和风险。


预期目标:

到2026年,研发支持至少3种指令集芯片的训推一体机,针对至少5个行业开展人工智能训推一体机应用,为用户提供多元化训推一体化服务,并在至少10种不同的场景进行人工智能训推一体机落地。


(五)大规模异构算力集群推理加速技术


揭榜任务:

研发存储、网络、计算的协同优化技术,通过模型加速、调度加速等方法实现大规模异构算力集群在大模型推理方面的加速,从而支持更大的模型、更长的上下文、更高的性能及更低的能耗,促进算力芯片在大模型推理方面的更好应用。


预期目标:

到2026年,实现集群有效吞吐量5倍以上提升,实际应用场景中可处理的请求数提升1倍以上,首字延迟性能提升1倍以上,芯片利用率提升50%以上。通过优化算力中心计算、存储、网络的配比以及拓扑结构和系统调度策略,实现千卡以上异构集群在推理加速领域的突破。


存储


(六)磁光电融合存储系统


揭榜任务:

针对单一存储介质难以满足多样化数据存储 需求的现状,依托磁、光、电存储在性能、寿命、功耗等方面的差异化特性,将磁、光、电存储技术进行融合,研发磁光电融合存储系统,构建基于固态硬盘(SSD)、机械硬盘(HDD)和光存储的多级存储架构。根据业务特征,将数据保存在不同级别的存储设备中,实现海量数据的集中、统一存储管理,支撑算力中心高效、低碳、安全持续发展。


预期目标:

到2026年,研发磁、光、电融合存储系统,支持适配分布式文件、分布式块和分布式对象等至少3种存储类型,系统可以根据数据的访问时间、访问频率、文件属性等自定义分级策略,根据业务负载动态调整迁移。系统可通过介质安全、系统安全、软件安全等夯实底层安全能力,通过防勒索、加密算法、远程监控、光存储预警检测等增强数据安全能力。打造磁光电融合存储应用示范,完成至少20个业务系统应用,实现至少4个东部地区数据流动至西部磁光电存储系统,且数据存储量不少于10PB。


(七)存储调度管理及应用技术


揭榜任务:

针对海量数据存储和算力孤岛问题,研发跨域多算的存力调度、存网编排和存算网一体化系统,实现数据的智能冷热分级、应用的跨域无感访问等能力,有效降低成本、提高性能和支撑业务。系统具备资源规划、策略调整能力,可优化和调整全网数据存储布局,实现对不断变化的需求的适应。


预期目标:

到2026年,研制具备高效、可扩展性的存 储系统,基于智能算法,对数据进行分析和调度,实现应用无感访问和智能流动。研究存力调度策略,使数据召回率控制在30%以下;研究基于潮汐网络调度算法,实现网络带宽利用率提升50%以上,达到存网一体的目标。集成存储、计算和网络的能力,支持存算网一体化调度,在算力中心资源池落地应用。


网络


(八)高性能数据处理器(DPU)


揭榜任务:

开展基于芯粒(Chiplet)和第五代精简指令集(RISC-V)技术的软硬件一体DPU芯片技术研究,支持算力中心、智算中心、超算中心场景所需的超高带宽和超低时延,突破Chiplet异构芯片封装技术、高速Serdes通信、大规模无损网络拥塞算法、硬件密码算法、高性能虚拟化、硬件可编程等技术,实现基于ARM、X86、RISC-V等异构核心的DPU应用,提升算力中心基础设施处理能力和数据传输能效比。


预期目标:

到2026年,完成超高性能DPU芯片研发工作,吞吐能力达到400Gbps,单向流量时延不高于30us,支持与国内外主流CPU、GPU芯片平台的适配,支持主流操作系统兼容,支持数据报文硬件处理逻辑可编程。


(九)基于 RoCE 的智算网络


揭榜任务:

面向RoCE网络开展设备及管控系统研发,通过提高设备带宽、优化负载均衡算法、强化网络流量规划 及运维能力等方式,提升RoCE网络的吞吐量和时延性能。研制新一代智能化管控工具,引入AI大模型能力,简化RoCE网络的部署和配置工作,实现全局、多维度的可视化运维。在网络波动、业务变更、故障等情况下,网络参数自动调整,流量快速切换,从而达到提升网络效率和降低运维成本的目标。








请到「今天看啥」查看全文


推荐文章
一条  ·  还记得你的第一次吗?
8 年前
电台工厂  ·  分享 | 广播,还有什么用?
7 年前
田俊国讲坛  ·  8月25~27日田俊国牛师修炼训练营第三期
7 年前