专栏名称: 电子工程专辑
电子工程专辑是中国创建较早的电子工程类网站,是《电子工程专辑》杂志的有力补充。专注为工程师提供最新技术及实用方法的专业平台。包括:16个热门技术栏目在内的,新品信息和新闻报道、专题报道以及厂商应用报告、行业重要新闻的信息速递。
目录
相关文章推荐
BioArt  ·  Neuron | ... ·  2 天前  
生信人  ·  癌症研究新视角,发文利器血小板 ·  4 天前  
生物制品圈  ·  百利天恒,双抗 ADC 技术 ... ·  4 天前  
生物制品圈  ·  专利悬崖密集来袭,制药巨头“东海求仙” ·  4 天前  
51好读  ›  专栏  ›  电子工程专辑

收官之作?谈谈IMG新推出的GPU

电子工程专辑  · 公众号  ·  · 2025-02-27 11:19

正文

这几年,人工智能(AI)行业的发展可以说是风起云涌。从2022年底ChatGPT的横空出世,到2025年春节期间DeepSeek的火爆出圈,全球AI产业格局正不断被重塑。业内人士认为,DeepSeek的出现将大幅降低中小企业进入人工智能领域的门槛,也将让功耗敏感性设备成为推动数字经济发展和创新的关键力量。

当下,大家已经意识到AI不止于云,端侧是模型应用不容忽视的重要场景。不过边缘计算与端侧 AI 的应用呈爆发式增长,对设备功耗的要求愈发严苛。无论是追求长效续航的智能手机,还是对功耗及散热有着严苛标准的物联网设备,亦或是致力于高效能源管理的汽车电子系统,越来越多的AI计算和推理工作负载开始在边缘终端运行,对图形计算与AI加速性能提出了更高要求。

以智能手机为例,随着移动游戏、AR/VR 应用的兴起,用户对手机图形渲染质量和流畅度的期望越来越高。这不仅要求 GPU 能够提供强大的图形处理能力,还要在有限的功耗范围内保持稳定高效运行。

正如Counterpoint Research的合伙人兼副总裁Peter Richardson所说,“全球智能手机市场正在复苏,推动力来自于尖端的AI功能,如个人助手和增强摄影。然而,这场由AI驱动的革命的成功,依赖于保持用户期望的高标准:流畅的界面、精致的设计和全天候的电池续航。随着市场的成熟,消费者更倾向于选择能够无缝整合这些先进AI功能且不妥协手机基本性能的高端设备。”

换句话说,消费者们对于AI加持的手机是欢迎的,但“既要又要”的他们,不能接受AI功能导致手机其他性能下降,这无疑需要一款更给力的GPU。

端侧设备需要的GPU

2 月 25 日,Imagination Technologies(以下简称"Imagination")推出了其最新GPU IP产品——Imagination DXTP,专为智能手机和其他功耗受限、但仍致力于为用户提供卓越游戏体验和最新生成式人工智能体验的设备打造。基于先进图形和计算加速技术,DXTP在性能和能效方面实现了重大突破,成为智能手机、平板电脑、笔记本电脑以及非安全关键型汽车应用等场景的理想选择。

通过一系列微架构改进,与前代产品IMG DXT GPU相比,DXTP在主流图形工作负载中可实现高达20%的能效(FPS/W)提升。

据介绍,DXTP效率的提高来自于对 GPU 内部一系列模块(如纹理处理单元)的微调,目的是节省功耗。在保证高性能的同时,最大限度地延长设备的续航时间,可以说为功耗受限设备上的先进图形和计算加速树立了新标杆。

据介绍,DXTP GPU在1GHz主频下可提供高达64 GPixel/s的像素填充率、2 TFLOPS FP32浮点性能和8 TOPS INT8整数运算性能。目前已推出DXTP-48-1536和DXTP-64-2048两种标准化配置,并获得移动和汽车市场的授权许可。

值得一提的是,去年年底Imagination宣布停止对RISC-V CPU内核的开发,全力聚焦图形、人工智能和边缘计算领域。但Imagination承诺其GPU仍将适用于所有流行的 CPU 架构,包括 RISC-V,这从DXTP与众不同的固件上就可以看出。DXTP使用 RISC-V 作为固件处理器的基础,这表明 RISC-V ISA 具有广泛的适应性。,它嵌入在GPU内部,负责管理GPU的调度、工作负载优先级排序,以及与其他系统组件的通信。

除了通过微架构改进显著提升游戏和AI工作负载的性能与能效外,DXTP还继承了Imagination多项核心技术,包括:

1、实现完全安全GPU多任务处理的低开销硬件虚拟化技术 。据悉Imagination是第一家实现GPU硬件虚拟化IP授权的公司,这种技术就像是为 GPU 打造了一个安全的 “多任务工作间”,它可以让 GPU 实现安全的多任务处理,不同任务之间相互隔离,就如同每个任务都在独立的房间里进行,互不干扰。以DXTP为例,能够支持多达八个独立操作系统的运行,每个系统均在独立的硬件通道中运行,实现了内存的完全隔离,并允许对服务质量和工作负载优先级进行精细控制。

这不仅提高了系统的稳定性,避免了因任务冲突导致的系统崩溃等问题,还大大增强了系统的安全性,有效防止了恶意软件或非法操作对系统的攻击和破坏 ,为用户的数据和隐私提供了可靠的保障。

以汽车电子系统为例,在驾驶过程中,GPU 需要同时处理多个任务,如多个驾驶舱的显示界面渲染、高级驾驶辅助系统(ADAS)的图像识别和分析、车载娱乐系统的运行,同时处理更多以计算为核心的功能(如全景环视系统)等。有了硬件虚拟化技术,这些任务可以在 GPU 上安全、高效地并行运行,确保驾驶员能够及时、准确地获取车辆信息和驾驶辅助,同时享受舒适的娱乐体验,而不会因为某个任务的异常而影响整个系统的正常运行。

2、支持图形与计算操作并行处理的异步计算架构 ,使得GPU能够同时处理四种不同类型的任务:2D图形、几何处理、片段处理以及通用计算。这一架构打破了传统的顺序执行模式,让图形处理和计算任务可以同时进行。在传统的 GPU 架构中,图形操作和计算操作通常需要按顺序依次完成,这就导致了在处理复杂任务时,效率低下,任务处理时间长。而异步计算架构则允许 GPU 在执行图形渲染任务的同时,进行 AI 计算等其他任务,大大提升了运算效率,减少了任务处理时间。

在运行一款大型 3D 游戏时,GPU 不仅需要实时渲染精美的游戏画面,还需要处理游戏中的物理模拟、AI 角色的行为决策等计算任务。异步计算架构使得 GPU 能够同时处理这些任务,让游戏画面更加流畅,物理效果更加逼真,AI 角色的反应更加智能,同时还可以管理用户界面以及常规的数据传输和内存管理任务。

这些特点,让DXTP相较于市场上其他解决方案,在灵活性更胜一筹,能够在保持相同性能和能效的同时,兼顾图形和计算工作负载,或两者并重。

D系列矩阵:从移动光追到汽车安全

熟悉Imagination的工程师朋友应该知道他们在GPU领域的实力,产品系列包括A系列、B系列、C系列以及 D系列家族。包括DXTP在内的D系列GPU IP产品有—— DXD(桌面级)、DXS(汽车级)、DXT(移动光追)

这多个不同门类的系列,共同构建了Imagination覆盖全场景的GPU技术版图,我们来回顾一下D系列的产品:

  • IMG DXD:云游戏的“破局者”

DXD 2023年11月发布,专为台式机、笔记本电脑和云游戏图形体验等桌面级市场设计,支持硬件级DirectX 11 Feature Level 11_0接口与多核扩展,其性能是2020年推出的图形处理器 IMG BXT 单核性能的 2.25 倍,双核配置能提供 5 TFLOPS FP32 和 144 GTexel/s 的性能;HyperLane虚拟化技术实现单核承载8用户,能够流畅运行主流DX11 PC游戏及其他Windows应用程序。

Imagination 在台式机市场拥有悠久的历史,其 PowerVR 图形技术可以追溯到 1992 年。而DXD的推出,让云游戏厂商在成本与体验间找到平衡,使得Imagination在桌面GPU市场占据了重要地位。

  • IMG DXS:汽车安全的“守护者”

DXS 2024年9月发布,是为汽车市场量身打造的GPU IP产品。此前要实现ASIL-B等级功能安全,传统的双核锁步(Dual-core lockstep)技术需要将核的硅面积(和成本)增加。DXS采用了创新的分布式安全机制,以最小的面积代价实现了ASIL-B, 计算工作负载性能较前一代汽车 GPU IP(IMG BXS)提高了十多倍, 峰值性能提高了 50%。

DXS的推出,让GPU在汽车中的角色不再仅限于图形处理。它不仅为汽车驾驶舱、信息娱乐和高级驾驶辅助系统(ADAS)提供了图形计算支持和处理AI工作负载,更解决了汽车行业长期面临的功能安全认证成本高的问题,目前累计出货量超3.95亿颗,多年保持市占率全球第一。

  • IMG DXT:移动光追的“开拓者”

DXT 2023年1月发布,作为D系列的首款移动GPU IP产品,将先进的光线追踪技术带入了移动设备。DXT支持光线追踪等级系统(RTLS)4级,相比上代产品(IMG CXT)的单位面积性能密度提升20%,最大单核性能提升了 50%,同时大幅降低了功耗。

DXT可从节省面积的 0.5 RAC(光线加速集群)配置扩展到高性能的 4 RAC 设计,其搭载的着色器处理单元(SPU)支持Vulkan的片段着色率(FSR)技术,能够在不牺牲视觉质量的前提下,大幅提高图形性能。

DXT采用的Volcanic架构,促得移动设备上的图形处理能力得到了质的飞跃,推动了移动光追技术从高端走向主流设备。腾讯、网易等厂商已基于其架构优化游戏引擎,数亿玩家因此得以在手机游戏上感受“桌面级视觉”。

如果要总结一下这三款D系列GPU如何选择,那么就三句话:

-对于寻求经过芯片验证并具备光线追踪功能的GPU技术的客户,DXT通常是Imagination旗下首选的GPU。

-对于需要支持Windows系统的客户,IMG DXD通常是最佳的GPU选择。

-对于有功能安全需求的客户,IMG DXS通常是最佳的GPU选项。

生态布局

在生态建设方面,Imagination 一直与众多行业领先企业有着紧密的合作关系。

在软件层面,与软件开发商、游戏引擎厂商合作,优化 GPU 在各类应用和游戏中的表现,确保能与主流软件环境完美适配。为开发者提供更好的开发工具和支持,让游戏能够充分发挥 Imagination GPU 的图形处理能力;在硬件层面,与芯片制造商合作,将 GPU IP 集成到各类芯片中,共同推动技术的落地应用。

DXTP也与其他D系列产品一样,得到了Imagination成熟软件生态与开发者工具的支持,包含针对主流AI任务优化的OpenCL™计算软件库,以及加速现有代码向Imagination硬件移植的oneAPI和TensorGraph参考工具包。

OpenCL是一个标准化、广为人知、高度灵活且经过优化的编程接口,其支持使得DXTP成为一款易于上手的处理器。借助对OpenCL的支持,软件开发人员能够在DXTP上运行各种通用计算和人工智能应用程序。

此外,DXTP还获得了针对一些最常见工作负载的优化OpenCL计算库的支持,例如神经网络(通过imgNN)、线性代数(通过imgBLAS)以及快速傅里叶变换(通过imgFFT)。这些库使DXTP能够为诸如机器学习任务(面部识别)、矩阵乘法(大语言模型)和信号处理(激光雷达目标检测)等流行的人工智能应用提供优化支持。与开源版本相比,这些OpenCL计算库可将人工智能工作负载的实际性能提升多达四倍。

操作系统层面,DXTP可支持 Linux、Android以及 UOS 和 Kylin OS 等新兴操作系统。Imagination正在和Android生态共同合作实现解锁GPU高性能计算。开发者可通过Imagination开发者论坛获取PowerVR调试工具链,享受底层性能分析、故障诊断、轨迹捕获等专业支持服务。

此外,Imagination的GPU架构建立在高度可编程和高度并行的计算理念之上。这一理念最初专注于图形处理,但同样适用于大多数现代人工智能工作负载。IMG架构的额外灵活性和可编程性意味着它不仅能够应对当前的人工智能网络,还能轻松适应未来的新网络,例如最近火爆全球的DeepSeek。

据悉,Imagination对D系列GPU进行了多项改进,使其在处理计算任务方面表现更加卓越,包括扩展了支持的数字格式范围,并将工作组项目的设置速率提升了16倍。与DXT相比,DXTP每个USC(Imagination的GPU计算单元)的带宽额外提高了50%,这有助于提升那些带宽受限层的网络性能。

是“收官之作”,也是新的征途

Imagination在GPU 领域的实力,不仅体现在其产品线和技术上,更体现在对行业发展趋势的洞察和创新的能力。从最早的PowerVR架构到如今的D系列GPU IP,Imagination始终走在技术的前沿,为全球数十亿设备提供高性能图形和计算支持。最新的DXTP使得智能手机能够在不牺牲电池续航能力、外形尺寸或用户体验的情况下,通过GPU满足不断增长的人工智能处理需求。

Imagination首席产品官James Chapman强调:“Imagination DXTP是许多小步伐带来大进步的真实例证,也是Imagination工程团队聪明才智的体现。DXTP内一系列性能和效率的改进将使未来的智能手机能够以比以往更低的功耗运行下一波游戏和AI应用。”

作为Imagination D系列GPU的收官之作(the ultimate D-Series product),DXTP与面向桌面市场的DirectX FL11_0高性能GPU IMG DXD,以及专为车规安全市场打造的创新产品IMG DXS共同构成了完整的产品矩阵。

在过去两年中,Imagination见证了中国半导体行业对AI技术需求的增长,并坚信这一领域为公司提供了前所未有的巨大机遇和激动人心的挑战。与处理像素相似,人工智能处理同样需要高度的并行计算能力,而GPU正是加速这类运算的理想选择。

如今,中国GPU市场正在迅速多样化,各家新创公司或瞄准AI应用,或专注图像处理,加快产品上市速度。这种需求不仅推动了Imagination在中国IP业务上的持续发展,还促进了与众多客户的深度合作,基于Imagination的GPU技术和生态系统,共同定义和开发了即将广泛应用的边缘智能(edge AI)和端侧应用。通过与 Imagination 这样经验丰富的IP供应商合作,有利于让芯片设计工程师更专注于满足客户差异化的需求,各方共同努力将创新和创意转化为切实可行的工程解决方案。 (责编:Luffy)

往期推荐

我在比亚迪做软件工程师,协议都学麻了...

2025-02-22

图片

iPhone 16e,谁会买......啊?

2025-02-22







请到「今天看啥」查看全文