专栏名称: 海南省数据产品超市
海南省数据产品超市通过有序开放公共数据资源整合社会数据资源,引进具有技术服务能力和研究分析能力的大数据企业、机构和团队,进行数据产品开发生产、供需对接、流通交易,构建统一公平、竞争有序、成熟完备的数据要素市场体系,促进自贸港数字经济的发展。
目录
相关文章推荐
APPSO  ·  号称接入DeepSeek键鼠产品单日销售近百 ... ·  11 小时前  
APPSO  ·  OpenAI 突然公开 o3-mini ... ·  昨天  
小众软件  ·  本地不联网安装 Windows ... ·  3 天前  
小众软件  ·  RMVA 在 Steam ... ·  4 天前  
51好读  ›  专栏  ›  海南省数据产品超市

国家发布|全国一体化算力网应用优秀案例合集(一)

海南省数据产品超市  · 公众号  ·  · 2024-09-15 15:53

正文

8月28日,国家数据局在2024中国国际大数据产业博览会“数算一体,驱动未来”交流活动上发布《全国一体化算力网应用优秀案例集》。

为充分展示全国一体化算力网建设领域取得的应用成效,国家数据局组织开展了“全国一体化算力网应用优秀案例”征集遴选工作。各地方积极响应、踊跃参加,共推荐报送案例221个,涵盖多元算力一体化布局、东中西部算力的一体化协同、算力与数据算法一体化应用、算力与绿色电力一体化融合、算力发展与安全保障一体化推进等五个方向。首批遴选出25个优秀案例,旨在展现这一领域的探索成果和创新突破,加快推动全国一体化算力网建设,赋能经济社会发展。

案例一:构建算力基础设施 铸就多元算力一体化布局
推荐单位:北京市政务服务和数据管理局、北京市通信管理局

申报单位:中国电信股份有限公司北京分公司、天翼云科技有限公司

随着人工智能大模型应用蓬勃发展,大模型训练存在的计算显存限制、风冷算力密度较低、智算资源利用率较低等问题日益突出。中国电信不断优化算力设施建设布局,加快研发落地息壤算力调度平台,显著提升算力协同调度能力,实现多元算力一体化布局。

一是建设超大规模高性能智算中心,赋能行业数字化转型。 建设业内领先的液冷高性能公共智算中心,提供4000PFlops总算力供给,可满足万亿参数模型训练。采用基于全栈AI软硬件平台方案,实现算、存、网、电、冷一体化设计,实现电能利用上的增效,依托超大规模智算集群强大计算能力,赋能千行百业数字化、智能化转型。

图1 “超大规模液冷智算集群”平面部署图

二是打造智算服务平台,满足多场景需求。 依托天翼云自主研发的“慧聚”“云骁”“息壤”三大平台,提供高算力、高吞吐、高兼容性训练能力,支持第三方算力以算力插件模式实现标准化接入,支持主流框架及芯片,有效满足大规模、高性能、多样化异构算力跨区域调度需求。

图2 智算调度平台架构图

三是发布互联互通验证平台,提升算力协同效率。 三大平台实现通算、超算、智算的统一资源注册接入,算网一体化调度,算力交易等核心功能,通过“算力调度服务”相关认证,不仅可以促进跨主体、跨地区、跨架构的算力互联互通,而且能够优化算力资源配置效率、增强多场景适应能力。

目前,息壤已接入智算算力22EFlops,纳管适配多种智算芯片,支撑北京区域近200家企事业单位数字化、智能化转型升级,产生了良好的经济社会效益。


案例二:异构融合、应用引领、促进数据互联互通的超算互联平台

推荐单位:天津市数据局

申报单位:国家高性能计算机工程技术研究中心
国家高性能计算机工程技术研究中心以应用引领、实现算力高效利用为目标,构建了国产软硬件协同、跨区域算力调度的超算互联平台。平台以互联网模式运营算力设施,实现了对分布式算力资源的统筹调度,形成了互利共惠的算力生态圈,促进了我国算力资源的高效利用。超算互联平台实现了三方面的技术和模式突破:
一是构建了多元异构算力资源池。 通过应用封装、算力标准化等方式,连接“东数西算”工程西部(重庆)科学城先进数据中心等多种形态的算力资源,实现了全国14省20余城市100余家算力联合体成员的全面入网,统筹异构算力,完成多元算力高效组网。
二是打造了支撑算力互联服务的软件生态。 通过建立共性工具库、数据集、应用软件库等,实现了连接上游270余家各类应用服务商、下游100余个行业的软件生态构建,支撑了1000余个应用场景的算力需求,促进算力供需方的高效对接,推动算力广泛应用。
三是支撑了算力应用领域的标准化体系建设。 规范算力的接入、调度、服务和运营等,发布《超算互联网白皮书》,完成多项国家标准、团体标准的立项和研制,积极推动我国算力服务标准化发展。
截至目前,超算互联平台发布算力商品6000余款,服务用户超10万个,形成算力多元、领域全面、高效运行的服务平台,促进我国算力资源的网络化、普惠化、标准化发展,支撑构建全国一体化算力网建设。

图1 超算互联平台整体架构

案例三: 临港算力创新实践 提升枢纽节点集约化成效
推荐单位:上海市数据局

申报单位:临港算力(上海)科技有限公司

针对当前国内算力供给存在多元组合算力交付周期长、算力资源分散难以被集中调用等问题,临港算力(上海)科技有限公司与长三角国家枢纽节点上海青浦集群加强业务协同,通过一系列工程和技术创新实践,提升枢纽节点集约化成效。
一是建设创新型的“两弹一优”基础设施。 临港算力网通过弹性供电、弹性供冷、机房气流组织优化的“两弹一优”,实现多元算力组合快速交付。弹性供电方面,通过机柜设备的“小母线+弹性方舱”配电系统,一舱解决不同客户集群部署模式带来的机柜功率变化需求。弹性供冷方面,采用冷冻水系统、热管多联系统、液冷系统等多种数据中心冷却手段,统筹预留基础设施管井及接口,实现制冷技术弹性应用。机房气流组织优化方面,通过流体动力学模拟计算机架和机房的气流组织,精细化设计冷热通道,开展建设性设计和周期性优化,综合提升供冷效率。

图1 弹性制冷循环系统与能效分布图

二是通过创新性研究解决行业难点问题。 通过使用中距离跨区RDMA(远程直接内存访问)进行市内算力组网,解决算力资源分散无法被集中调用的问题。通过使用跨区RDMA协议和广域拓扑感知并行策略,对跨数据中心大模型训练提出针对性模型训练策略建议,为客户提供合适的解决方案,提升训练效率。联合国内算力上下游生态合作伙伴为客户提供适配测试服务。

自2023年9月投入运营以来,建设大规模商用液冷资源池,通过“两弹一优”实践创新解决机柜功率的变化需求,支持单列机柜功率密度从8kW到48kW之间灵活适配。目前,跨区RDMA组网已完成128、512卡30KM对比验证,训练效率可达单集群的95%以上,完成5家大模型训练性能测试,支撑星辰115B等基础大模型平稳训练,集群可用率达到90%以上。

案例四: 打造智算算力网AI开发平台 助力人工智能基础设施发展

推荐单位:江苏省数据局

申报单位:中科南京信息高铁研究院
当前,人工智能基础设施存在技术标准不统一、算力使用门槛高等问题。中科南京信息高铁研究院研发智算算力网AI开发平台,统筹纳管异构异属异域的智算资源,实现全局能用、好用。

一是汇聚三异智算算力资源,实现多元算力协同。 智算算力网AI开发平台汇聚异构异属异域的三异智算算力资源,通过代理与适配两种并网模式构建一个全局可用的智算算力资源域,基于协同调度服务,实现智算算力资源的全局共享,构建了南京、昆山与郑州三地的智算算力网。

图1 智算中心集群图

二是构建全流程AI能力体系,降低智算算力使用门槛。 构建覆盖AI算法开发全生命周期的AI能力,提供6种AI开发框架、3种分布式训练加速框架、4种分布式并行训练策略以及弹性高性能推理等能力,提高大模型开发效率,适配4种底层智算异构资源,提供统一的智算算力网页。

三是创新平台运营模式,减少用户算力使用成本。 通过构建融合运营模式整合多方运营平台,实现智算资源池统一运营,将账单管理、资源规格管理等业务模块进行统一管理。平台上线后,用户算力月度成本从10021.26元/P降至6062.79元/P,降幅达39.5%,与同类平台用户月度平均费用相比成本降低50.96%。

图2 大模型应用案例示图

目前,智算算力网AI开发平台累计落地7个领域的50多个科研行业大模型,如翻译大模型“百聆”,抗体结构预测大模型,医疗大语言模型等,以“三异四入”模式,实现3个算力中心的“三异”算力并网,提供覆盖5个园区、15家重点企业、3所高校及200户家庭算力终端的“四入”服务。


案例五: 构建算网融合平台 赋能行业场景应用
推荐单位:山东省大数据局

申报单位:山东省计算中心(国家超级计算济南中心)、 济南超算产业发展有限公司

当前,我国算力资源面临跨域调度难、国产算力生态欠佳等挑战。山东省计算中心(国家超级计算济南中心)贯彻落实构建全国一体化算力网的决策部署,统筹跨域多元算力融合一体化发展,打造了覆盖全省的一体化算力网工程,实现了多元算力的高效汇聚、纳管和服务。

一是突破算网融合技术壁垒,打造高性能算网平台。 山东省计算中心加快推进长距无损网络通信、跨域算网资源全局调度等关键技术研发应用,成功推动“山东算网”平台上线,实现5种算力架构、3类12种算力集群、5类存储系统的接入和感知,支持大数据、人工智能、高性能计算等融合计算场景。

二是构建区域一体化算网体系,积极融入国家算力枢纽。 建成以济南—青岛超算为两大核心节点、连接山东16市骨干节点和100余个边缘节点的省域算力网络,接入天津超算、鹏城云脑等国家级算力平台,融入京津冀、粤港澳大湾区、甘肃、宁夏、内蒙古等算力枢纽节点建设,实现与枢纽节点的算力共享。

三是融合跨域异构算力资源,推动算网赋能千行百业。 汇聚融合全省16地市及周边省份算力资源,提供多元化算力服务,入网算力中心资源利用率平均提升40%,赋能海洋、空天、环保、教育、数字政府、人工智能等领域1000多个应用场景,打造算力产业链多元协同运营管理模式,构筑算网服务生态。

山东省计算中心“山东算网”平台汇聚了全省高性能算力、智能算力,提供行业数据集9PB、模型算法90种、计算软件1500余款等全要素算网服务,累计服务各类行业用户3000余家,直接经济效益10亿元,为用户节省算力与运维投入5亿元。

图1 算网服务支撑平台


案例六: 以算力赋能人工智能产业发展 打造东数西算成渝枢纽新引擎

推荐单位:四川省发展和改革委员会(四川省数据局)

申报单位:智算云腾(成都)科技有限公司

为全面落实国家“东数西算”工程战略部署,作为成渝国家枢纽节点天府数据中心集群首批智算中心,成都智算中心以人工智能应用需求为牵引,持续提升高质量智能算力供给能力,强化高性能算力互联互通,不断提升算力资源利用率和软硬件适配水平,孵化算力调度与模型赋能相结合的创新成果,积极推动全国一体化算力网建设。

一是需求牵引,持续提升区域人工智能产业供给能级。 在天府数据中心建设FP16、FP32等多精度、多样化智能算力,并通过多样化算力扩容建设强化高质量算力供给能力。累计服务本地用户200余家,平均降低算力成本约2/3,在智慧城市、医疗、交通等成都市优势领域孵化280余项人工智能解决方案,完成主流NLP大模型本地环境适配,实现区域化人工智能生态聚集。

二是跨域联动,重点推进西部高性能算力互联互通。 立足成渝国家枢纽节点布局,筹划建设四川算力调度服务平台,探索共建川渝协同一体化算力调度体系,可调度算力超过200PFlops,覆盖成渝双城经济圈企业150家以上,实现西部地区高性能算力的高效互联与利用。建设鹏城实验室全国开源平台分中心和C2NET算力网西部运营中心,每年接入算力约11万卡时。

三是东西协同,积极开展人工智能大模型孵化研究。 牵引东部算力需求,联合研究孵化了跨模态遥感数据生成式预训练大模型“空天·灵眸”、金融领域千亿级参数大模型“玉兰”、新一代短临气象预报基础模型“蓉城·夔牛”等多个人工智能大模型并成功落地应用,实现了东西部数据高质量传输和按需配置,算力资源使用效率持续保持95%以上。

图1 面向跨模态遥感数据的生成式预训练大模型“空天·灵眸”


案例七: 贵州枢纽节点算力调度平台实践 融入全国一体化算力网规划

推荐单位:贵州省大数据发展管理局

申报单位:贵州省算力科技有限责任公司

根据《深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》等文件有关打造全国一体化的算力监测调度平台体系,促进算力资源跨地区高效协同的要求,贵州算力公司从贵州实际出发,着力打造全国一体化算力网络国家(贵州)枢纽节点调度平台(以下简称“调度平台”),汇聚全省算力资源,重点解决算力资源供需匹配不足、资源分散建设等问题,实现算力接入更可信、交易更便捷、调度更高效、服务更普惠,全面助力全国一体化算力网建设。

一是建设“大衍”算力调度平台,实现多元算力汇聚调度。 调度平台突破算力度量、算力感知、算网融合多项技术,全面支持通算、智算、超算多种异构算力的统一接入、统一封装、统一调度;灵活根据算效、碳效、时延、安全等策略,实现算力有效调度,服务“东数西算”等重大工程。

图1 算力调度平台架构图

二是建设高性能算力资源池,打造算力领域标杆案例。 推动调度平台算力资源应用,贵州算力公司投资建设了气象高性能算力资源池,打造智算和超算一体的高性能算力资源平台,辅助贵州省气象局将气象预报空间分辨率从5公里精细至1公里,时间分辨率从3小时精细至1小时,进一步发挥气象防灾减灾第一道防线作用。

图2 高性能算力在气象领域标杆案例图

三是创新发放“算力券”,降低企业用算成本。 以政府政策为引导,以调度平台为载体,创新发放“贵州算力券”,形成算力消费、数据资源流通与特色产业联动的激励机制,为企业提供多样化的激励,帮助用户降低用算成本费用门槛。

截至目前,调度平台已汇聚33个算力服务商、401个算力需求方,算力资源达4.5Eflops,对外可提供102项算力产品,累计完成算力交易28.85亿元,在算力资源汇聚与运营方面,为全国一体化算力网发展提供贵州实践经验。


案例八:绿色智能算力“铁三角”赋能千行万业

推荐单位:贵州省大数据发展管理局

申报单位:华为云计算技术有限公司

数字经济的快速扩张和人工智能技术的广泛应用,对高效算力资源配置和持续技术革新不断提出新需求。华为云计算技术有限公司建设绿色数据中心和人工智能平台,打造算力铁三角布局,提供全栈AI解决方案,赋能千行万业智能化发展。

图1 智能时代算力需求规模

一是构建算力“铁三角”。 华为云在贵安、内蒙古(乌兰察布、和林格尔)以及芜湖等国家枢纽节点建立3个超大绿色智算数据中心,单数据中心规模超过百万台服务器,为京津冀经济圈、长三角经济圈、珠三角经济圈、中西部地区等地提供充沛的算力支持,支撑构建资源高效调度、设施绿色低碳、算力灵活供给、服务智能随需的算力基础设施,助力产业高端化、智能化、绿色化发展。







请到「今天看啥」查看全文