专栏名称: 数据中心运维管理
专注于数据中心基础设施运维与运营管理,分享运行维护经验,分享数据中心行业发展趋势及新技术应用。
目录
相关文章推荐
数据分析与开发  ·  为 DeepSeek 辟谣:五大误解与真相解读 ·  16 小时前  
AustinDatabases  ·  MySQL ... ·  2 天前  
AustinDatabases  ·  MySQL ... ·  2 天前  
数据分析与开发  ·  取代数据岗,某司数据从业人员已集体转行.... ·  3 天前  
AustinDatabases  ·  ORACLE 最终会把 MySQL ... ·  3 天前  
数据中心运维管理  ·  机房巡检必须关注的指标 ·  4 天前  
51好读  ›  专栏  ›  数据中心运维管理

2025年AI将改变数据中心建设的本质

数据中心运维管理  · 公众号  · 数据库  · 2025-02-06 09:05

正文



短短一年时间,变化之大令人惊叹。去年我们注意到,数据中心对AI算力的需求呈指数级增长,这将迫使我们采用更高效的流程、更快的建设速度,以及更具创造性的解决方案来应对持续存在的IT人才短缺问题。
事实证明这个判断完全正确-实际情况甚至超出了所有人的预期。
根据高盛( GoldmanSachs )发布的2024年5月展望报告,AI部署预计将导致数据中心电力需求激增高达160%,这表明在资源竞争日益激烈的情况下,管理这种增长的紧迫性日益凸显。
国际能源署(IEA)估计,2022年全球数据中心消耗了460太瓦时的电力(PDF),约占全部发电量的2%-预计这一数字到2026年将翻倍。原因很明显:与其他形式的处理相比,AI部署需要更强大的算力,因为耗电量大的GPU正在努力满足不断增长的需求。
2024年,采用更高效策略的需求变得明显。到2025年,我们将看到这些策略付诸实践。目前已经有一些重大举措和大胆计划摆在桌面上,这些数据中心建设的变革将推动云计算迈向新的台阶。



AI驱动因素-大规模计算走向小型化
AI应用向个人和职业生活各个方面的扩展令人叹为观止。我只能将其比作20世纪90年代末 万维网 的早期阶段,那是我们首次接触到全球互联网。互联网最初只是一个新奇事物,时而被过分炒作时而被轻视,但很快就成为现代生活中不可或缺的一部分。
据说电话从发明到成为普通家庭必需品用了50年时间。互联网只用了约20年。现在,AI似乎将在更短的时间内实现同样的目标,因为它在企业领域快速找到新的应用,而这些应用的绝大多数都将由数据中心提供支持。
AI在企业中的创新应用呈抛物线式增长-我们对AI在商业、科学和社会本身的影响仅仅触及表面。具有讽刺意味的是,几十年来最大的创新正通过企业空间以越来越小的方式发挥影响。
数据中心建设蓬勃发展
科技巨头们正在以前所未有的规模进行建设,随着AI计算的淘金热式竞赛加剧,他们的10年资本支出平均水平不断攀升。
不仅是AI技术在发展,其交付模式也在演变。AI即服务为企业采用AI功能铺平了道路,特别是生成式AI,它可以在客户服务到长期财务规划等多个领域发挥作用。
事实上,数据中心本身越来越多地使用生成式AI来解决长期存在的熟练IT员工短缺问题,通过使用AI来监控、管理和支持精简的IT团队,使他们能够提高生产力。通过直观的提问和获取建议的方式,较初级的IT团队可以发挥超出其水平的能力,缓解数据中心面临的劳动力压力。
随着这些建设的开展,获得充足电力的可靠性仍然是一个挑战。根据贝恩公司( Bain&Company )在UtilityDive最新报告中分享的数据,数据中心消耗的全球发电量比例不断增长,这种趋势将在可预见的未来持续,到2028年可能占电力需求增长的44%。大多数地区过剩能源供应的稀缺性正推动新的数据中心建设转向新的且有时是意想不到的地点,以确保靠近可负担的发电源,或租用专用电网电力来保障供应。
阅读最新的AI数据中心新闻
我们都看到了数据中心最近为支持其增长而采用专用核能发电的报道。我们预计在2025年及以后会看到更多这样的案例。
选择核能是合理的:这种能源来源稳定、可扩展,与化石燃料驱动的能源相比相对可持续。同时,数据中心正在尽可能降低能源消耗-既出于经济考虑也出于环境责任-通过部署水冷系统来替代效率较低的强制空气冷却。
随着GPU驱动的AI计算规模增加,这些效率将变得更加明显,网络正常运行时间增加的好处也将更加明显,因为过热是导致停机和组件过早失效的主要原因。
基础设施规模的缩小
与电力和冷却需求相关,数据中心的光纤基础设施在AI计算设施中继续变得更加密集。AI阵列中的GPU必须完全联网-每个GPU必须能够与其他每个GPU通信-这使复杂性增加了一个数量级,并使冷却变得更加复杂。为了克服所需光纤基础设施的体积问题,数据中心将使用高密度 光纤系统 来实现这些无数连接,在现有空间中装入更多光纤和连接器,为其AI网络提供动力。
通过将更多计算资源集中在更少的机架中,数据中心可以减少能源使用并简化冷却需求。此外,随着超大规模数据中心从2x400G(总计800G)迁移到原生800G,这种先进的光纤基础设施将提供一些急需的通道容量,以适应未来的需求。
多租户数据中心-标准化和灵活性






请到「今天看啥」查看全文