专栏名称: 人工智能学派
人工智能学派专注于分享:GPT、AIGC、AI大模型、AI算力、机器人、虚拟人、元宇宙等AI+160个细分行业!
目录
相关文章推荐
新闻广角  ·  美国解冻8.7亿美元对台军援,中方表态! ·  昨天  
新闻广角  ·  微信在电脑端也能收红包了 ·  2 天前  
新闻广角  ·  德国总理朔尔茨承认选举失利 ·  3 天前  
51好读  ›  专栏  ›  人工智能学派

人工智能专题:智算中心基础设施演进白皮书

人工智能学派  · 公众号  ·  · 2024-10-08 16:45

正文

如何下载资料?

微信扫下方二维码加入星球平台

【老会员续费特惠】

今天分享的是:人工智能专题:智算中心基础设施演进白皮书

报告共计:31页

《智算中心基础设施演进白皮书》由维谛技术和深知社联合发布,探讨了智算中心基础设施的演进趋势,主要内容如下:

- 智算中心的演进分析

- 智能算力发展:算力成为新生产力,分为通用、超算和智能算力,本白皮书重点讨论通用算力中心向智算中心的演进。智算业务包括训练和推理,推理算力占比将提升。

- 芯片结构演进:通用算力芯片以CPU为核心,智算算力采用异构计算架构,结合多种芯片,且存储芯片也有差异化需求。

- 用户侧诉求演进:通用算力用户诉求已成熟,智算中心用户诉求主要来自训练业务,需建立GPU集群,注重数据处理、硬件使用、软件分配和管理运维等方面。

- 机柜功耗高密度化演进:智算中心GPU芯片算力提升,散热功耗增加,单机柜功率密度从通算中心的4 - 6kW逐渐增加至智算中心的20 - 40kW甚至更高。

- 静态负载向动态负载演进:通算中心负载平稳,智算中心负载波动大,呈现周期性、大幅度、并发性、瞬时冲击等动态特性。

- 智算中心选址与规划

- 选址:优先考虑新能源丰富、网络资源良好且接近核心城市或其周边的区域,综合考虑多种因素,核算经济与能源费用的平衡点。

- 建筑形式:多层建筑更适合智算中心,可满足网络要求,大平层建筑虽可利用自然冷源,但可能影响通信时延。

- 建筑布局:通过优化建筑布局,如紧凑的集群组网及传输布局、合理的层高和承重要求等,提高智算中心算力和算效。

- 房间功能需求:注重功率密度、制冷、配电、网络等功能规划,增加相关区域面积,预留备品备件储存和设备调试空间,设置更多功能区。

- 装饰装修需求:注重结构安全、防水耐腐蚀、安装维护便利和环保节能,根据制冷方案确定地板高度,做好管线布局和安全防护。

- 已有建筑改造:考虑噪音、制冷等影响,对不同业务负载的智算中心采取不同改造策略,冷板液冷系统改动较小。

- 智算中心电气链路架构挑战及演进趋势

- 电气链路挑战

- 电力能源接入挑战:智算中心用电规模大,需接入更高电压等级的电网,能源供给成为瓶颈。

- 配电与IT机房的面积比挑战:单机柜功耗提升,供配电系统占地面积增大。

- 电能利用率挑战:传统2N配电架构效率低,需简化配电架构。

- 能源利用效率挑战:智算中心能耗大,需降低PUE。

- 服务器电源形式挑战:智算中心推理业务需后备电源,训练业务可间断供电。

- 智算负载分级供电挑战:需根据负载特性选择合适的供电方式,平衡成本与风险。

- 末端配电方式挑战:单机柜容量大,末端配电设施需支撑大容量供电。

- 负载动态冲击挑战:智算中心负载动态特性对供配电链路提出挑战,需利用多种能源确保供电。

- 环境温度突变挑战:智算中心服务器负载密度高且动态变化大,导致环境温度突变,影响电气元器件性能。

- 演进趋势 - “智算电能管理链”

- 电力能源系统向“算电协同”演进:采用简化配电架构,如DR/RR/N+1架构,提高系统利用率,降低成本,同时考虑锂电池替代铅酸电池和一体化电源方案。

- 简化供电系统架构演进:推广DR/DistributedRedundancy、RR/ReserveRedundancy、N+1等简化架构,减少配电设备占地面积,提高系统利用率。

- 智算负载分级供电演进:根据智算中心训练业务可间断负载的特性,选择合适的备电模型,提供分级供电服务。

- 预制电力模组演进:采用预制电力模组,减少电力室面积,缩短交付周期,提高利用率和可扩展性。

- UPS向MW级,超高效及高密化演进:UPS单机容量提升,功率密度增加,向MW级、超高效及高密化方向发展。

- 锂进铅退/储备一体演进:锂电池逐步取代铅酸电池,UPS主机与锂电储备融合,优化负载动态特性。

- 末端电压等级提升及全

以下为报告节选内容







请到「今天看啥」查看全文