专栏名称: 机器之心
目录
相关文章推荐
爱可可-爱生活  ·  优化思维:探索大模型推理能力的最佳计算规模 ... ·  16 小时前  
黄建同学  ·  Gemini Code ... ·  16 小时前  
黄建同学  ·  Anthropic ... ·  昨天  
机器之心  ·  超越DeepSeek-ProverV1.5! ... ·  2 天前  
51好读  ›  专栏  ›  机器之心

华为发布全球最快AI训练集群Atlas900,训练ResNet50仅需59.8秒,昇腾910加持

机器之心  · 掘金  · AI  · 2019-09-18 03:30

正文

机器之心报道

作者:李泽南、戴一鸣

在 8 月华为最强 AI 芯片昇腾 910 正式发布之后,今天,华为在全联接大会上发布了全新的整体计算战略,并正式推出了基于最新 AI 芯片的服务器 Atlas 900。
华为总裁任正非在最近接受采访时曾表示,华为即将发布全世界最快的人工智能平台。在今天的全联接大会上,华为揭幕了这款 AI 训练集群 Atlas 900:它成为了目前全球计算机的巅峰,其总算力达到 256P~1024P FLOPS @FP16,相当于 50 万台 PC 的计算能力。
「特别感谢在这个关键时刻大家对于华为的支持,」华为副董事长胡厚崑在发布会上表示。「感谢大家的关心,在这里我也向大家报告一下,华为的状态确实还不错。就像今天早上上海的天气一样,秋高气爽,云淡风轻。」
全球训练最快的 AI 集群 Atlas900
华为今天推出的 Atlas 900 可谓目前最强的 AI 计算机集群,它由 1024 块昇腾 910 芯片组成,后者可谓目前业界单芯片算力最强,的处理器。每块昇腾 910 AI 处理器内置 32 个达芬奇 AI Core,单芯片可以提供比业界高出一倍的算力(256TFLOPS@FP16)。
为了充分发挥 AI 芯片的能力,Atlas 900 AI 训练集群采用「HCCS、 PCIe 4.0、100G 以太」三类高速互联方式,实现了百 TB 级的全互联无阻塞专属参数同步网络,梯度同步时延可缩短 10~70%。
在 AI 服务器内部,昇腾 910 AI 处理器之间通过 HCCS 高速总线互联;昇腾 910 AI 处理器和 CPU 之间以最新的 PCIe 4.0(速率 16Gb/s)技术互联,其速率是业界主流采用的 PCIe 3.0(8.0Gb/s)技术的两倍,使得数据传输更加快速和高效。在集群层面,采用面向数据中心的 CloudEngine 8800 系列交换机,提供单端口 100Gbps 的交换速率,将集群内的所有 AI 服务器接入高速交换网络。
华为表示,在 AI 服务器内部,昇腾 910 AI 处理器之间通过 HCCS 高速总线互联;昇腾 910 AI 处理器和 CPU 之间则以最新的 PCIe 4.0(速率 16Gb/s)技术互联,其速率是业界主流采用的 PCIe 3.0(8.0Gb/s)技术的两倍。
胡厚崑表示,使用 Atlas 900,人们只需 59.8 秒就可以完成典型神经网络 ResNet-50 在 ImageNet 数据集上的训练,在同等精度下比第 2 名快 15%。「这相当于在短跑赛场上头名撞线,然后喝完一瓶水才看到第二名跑到终点。」

Atlas900 的强大算力,可广泛应用于科学研究与商业创新,比如天文探索、气象预测、自动驾驶、石油勘探等领域。在现场,华为展示了在天文领域上的应用。在与上海天文台、SKA 合作的项目中,科学家们使用 Atlas 900 高达 256P FLOPS 的集群算力,仅需 10.02 秒即计算了 20 万颗星体的扫描,同时可以准确地对某一类星体进行定位,如果人类进行这项工作的话,需要 169 天时间。
华为表示:「在 Atlas 900 出现之后,一切计算瓶颈都会消失。」
基于 Atlas 900 的超强算力,华为云今天也发布基于昇腾的华为云 EI 集群服务,现在人们已可以注册并开始使用。
华为认为,未来计算的主流将是机器学习。「未来基于统计的计算可以帮助我们更好地解决没有固定规则定义的问题,」胡厚崑说道。「这一类计算奠定了今天人工智能突破发展的基础,在未来将会逐步成为计算的主流。我们认为,在未来的五年时间里,基于统计的计算消耗的算力有可能会占到整个社会算力消耗的 80% 以上。」
2 万亿计算产业新蓝海
华为认为,未来的云计算领域将会出现新的巨大市场。据 Gardner 预测,2023 年全球计算产业总空间将会达到 2 万亿美元,其中包括企业 IT 的软件、硬件、云服务等。
如此发展空间正在推动华为不断加码投入。去年,华为提出了全场景战略。在今天的 HC 大会上,华为进一步介绍了自己的整体计算战略,其将从四个方面来布局:
  • 架构创新。投资基础研究,打造出了达芬奇架构,重点解决全场景智能的架构问题。

  • 投资全场景处理器。包括面向通用计算的鲲鹏系列,面向 AI 的昇腾系列,面向智能终端的麒麟系列,以及面向智慧屏的鸿鹄系列,将来还有一系列处理器,面向更多的场景。

  • 商业策略。华为处理器不直接对外销售,以云服务和部件为主面向客户,优先支持合作伙伴发展整机。

  • 构建开放生态。重点推进沃土计划 2.0,使能全球合作伙伴发展应用及解决方案。

「我们认为,未来的十年会是整个计算产业新黄金十年,计算产业会出现巨大的新蓝海,」胡厚崑表示。「五年之内,全球将会出现每年高达两万亿美元的市场。因此华为将向计算产业进行大量投入。」
2015 年,华为首次发布了沃土计划。在过去的四年中,华为已经发展了 130 多万开发者。在今天的发布会上,华为表示沃土计划在今年将继续投入 15 亿美元,使开发者的规模扩大到 500 万人。






请到「今天看啥」查看全文