1.Imagination发布首款PowerVR Series8XT IP内核;
2.可用于自动驾驶的神经网络及深度学习;
3.Cadence发布业界首款面向汽车 监控 无人机等的神经网络DSP IP;
4.华虹宏力与华大九天再联手 国产EDA工具助力IP设计;
5.ARM 发表 Mali-C71 影像讯号处理器
集微网推出集成电路微信公共号:“天天IC”,重大新闻即时发布,天天IC、天天集微网,积微成著!点击文章末端“阅读原文”或长按 laoyaoic 复制微信公共号搜索添加关注。
1.Imagination发布首款PowerVR Series8XT IP内核;
可为智能手机、AR/VR头戴设备及汽车融合产品带来功能强大、令人惊艳的SoC性能
集微网消息,2017年5月11日 ─Imagination Technologies 发布第一款以其最新的PowerVR Furian架构为基础的GPU IP内核 ─ Series8XT GT8525。Furian专为推动新一代的消费性设备所设计,能以移动功耗的预算提供长时间的高解析度、沉浸式图形内容以及数据运算功能。双集簇(two-cluster)GT8525可提供同类领先的性能、功耗与面积,以及独特的特性,以协助客户设计出适用于高端智能手机与平板电脑、中端专用型VR与AR设备、以及中级到高级的车用信息娱乐与ADAS系统等产品的SoC。
Imagination公司PowerVR产品及技术营销高级总监Chris Longstaff表示: “新款GT8525是Series8XT GPU系列产品的首个成员,采用我们具备优异效率与扩展性的Furian架构。此IP内核是为满足多种大量应用的市场需求而推出的。它持续并强化了PowerVR XT系列产品的每微瓦性能(performance/mW)领先地位,并且能支持非常丰富的特性组合。”
JPR Research总经理Jon Peddie表示:“Imagination在高端移动市场拥有强有力的业界实绩,Furian架构将能进一步强化其技术领导地位。凭借GT8525的推出,Imagination可为标准型移动GPU树立新的性能指标,并通过分块延迟渲染(TBDR)技术持续提供优异的功耗效率。”
ELVEES研发中心首席技术官Tatiana Solokhina表示:“做为多样化全球视频分析应用的SoC供应商,我们需要GPU能以有限的功耗提供最佳的运算性能。Imagination推出的新款PowerVR Furian 8XT产品可为我们提供业界领先的GPU,并具备新的ALU可实现更高的性能密度与效率。此外,它能支持OpenVX这类标准运算API,能够轻松创建真实世界的视觉处理应用。”
满足下一代的应用需求
Furian架构是专为满足下一代消费性设备不断演进的图形与运算需求所设计:
• 智能手机:GT8525可满足游戏应用所需的以有限的功耗预算持续提升稳定性能的要求,包括移动VR应用。它还能开启需要更多运算可用性(compute availability)的新型移动使用案例,例如利用神经网络(包括CNN)进行物体辨认。
• 汽车:GT8525大幅提升了运算效率并内置硬件虚拟化功能,可应对在同一SoC上将信息娱乐、电子仪表盘以及部分ADAS功能结合在一起的趋势。OEM厂商能将同步的功能与服务予以隔离,以确保更高的安全性,并节省宝贵的芯片面积。
• AR/VR:GT8525可提供高解析度与稳定的高频率图形功能,以符合独立式AR/VR头戴设备所需的绝佳用户体验。GT8525包括特别设计的硬件与软件,可将关键的移动时间延迟(motion-to-photon latency)降至最低。通过采用内置GT8525的芯片,OEM厂商能以更小的面积提供更高性能的图形与运算功能。开发人员能发挥OpenVX* API在PowerVR上执行的强大功能,实现快速的应用程序开发。
PowerVR Series8XT GT8525的性能数据
Furian架构是专为增强性能与功耗效率所设计,每微瓦性能远优于竞争的解决方案。与Series7XT GT7200 GPU相比,GT8525可达到:
• 针对Manhattan基准测试,这是移动与其他应用的业界标准测试,可提升超过50%的fps,以及提升80%的TRex
• 针对Antutu基准测试,这是另一项重要的基准测试,可提升超过50%的fps
• 2倍的PPC数据处理能力(每周期像素为8,GT7200为4),可实现更高的解析度与额外的性能,以支持先前受限于填充率不够的使用案例
• 提升超过50%的GFLOP,以及更多的可用GFLOP,能够更轻松地充分发挥内核的图形与运算功能
Furian架构的差异性优势
GT8525是以Furian架构为基础,此架构提升了性能、GPU效率与系统效率,能满足下一代应用所需的较低功耗与更佳的使用者体验。它采用了多项使PowerVR得以建立技术领先地位的优异特性,包括Imagination的分块延迟渲染(TBDR)技术,它已在PowerVR GPU几代产品上获得证明,可提供最高效率的嵌入式图形功能。
Furian还采用新的32宽(32-wide)ALU集簇设计,以提升性能与效率。在主要与次要的ALU管线中使用的新增指令集架构(ISA)可实现更佳的资源利用率与效率,而多线程的最佳化设计能使内嵌于芯片上的局部运算内存读取更具效率与灵活度。Furian是专为满足多种应用与市场日益提升的运算需求所设计,能够高效率地使用多种运算API,包括OpenCL® 2.0、Vulkan® 1.0和OpenVX 1.1*等。
供应情况
GT8525已提供给早期客户使用;即日起开始提供授权。更多信息,请联系[email protected]。
关于 PowerVR GPU
PowerVR 图形处理器 (GPU) 产品在技术性能、产品路径以及生态系统方面均是市场的领导者,已为移动与嵌入式GPU树立了业界标准。凭借先进且独特的架构,PowerVR 成为领先的图形技术。运用块状延迟渲染 (TBDR) 技术,PowerVR 的效率可确保最低的带宽使用以及单位任务的最低处理周期,因而可实现优异的性能效率以及单位架构的最低功耗,表现优于其他的解决方案。通过采用内置PowerVR 技术的芯片,OEM 厂商可将此优势带到其产品中,以提供最杰出的视觉体验以及最长的电池寿命。
2.可用于自动驾驶的神经网络及深度学习;
来源:集微网 作者:CEVA 汽车市场营销主管 Jeff VanWashenova
高级辅助驾驶系统 (ADAS) 可提供解决方案,用以满足驾乘人员对道路安全及出行体验的更高要求。诸如车道偏离警告、自动刹车及泊车辅助等系统广泛应用于当前的车型,甚至是功能更为强大的车道保持、塞车辅助及自适应巡航控制等系统的配套使用也让未来的全自动驾驶车辆成为现实。
如今,车辆的很多系统使用的都是机器视觉。机器视觉采用传统信号处理技术来检测识别物体。对于正热衷于进一步提高拓展 ADAS 功能的汽车制造业而言,深度学习神经网络开辟了令人兴奋的研究途径。为了实现从诸如高速公路全程自动驾驶仪的短时辅助模式到专职无人驾驶旅行的自动驾驶,汽车制造业一直在寻求让响应速度更快、识别准确度更高的方法,而深度学习技术无疑为其指明了道路。
以知名品牌为首的汽车制造业正在深度学习神经网络技术上进行投资,并向先进的计算企业、硅谷等技术引擎及学术界看齐。在中国,百度一直在此技术上保持领先。百度计划在 2019 年将全自动汽车投入商用,并加大全自动汽车的批量生产力度,使其在 2021 年可广泛投入使用。汽车制造业及技术领军者之间的密切合作是嵌入式系统神经网络发展的催化剂。这类神经网络需要满足汽车应用环境对系统大小、成本及功耗的要求。
轻型嵌入式神经网络
卷积式神经网络 (CNN) 的应用可分为三个阶段:训练、转化及 CNN 在生产就绪解决方案中的执行。要想获得一个高性价比、针对大规模车辆应用的高效结果,必须在每阶段使用最为有利的系统。
训练往往在线下通过基于 CPU 的系统、图形处理器 (GPU) 或现场可编程门阵列 (FPGA) 来完成。由于计算功能强大且设计人员对其很熟悉,这些是用于神经网络训练的最为理想的系统。
在训练阶段,开发商利用诸如 Caffe 等的框架对 CNN 进行训练及优化。参考图像数据库用于确定网络中神经元的最佳权重参数。训练结束即可采用传统方法在 CPU、GPU 或 FPGA 上生成网络及原型,尤其是执行浮点运算以确保最高的精确度。
作为一种车载使用解决方案,这种方法有一些明显的缺点。运算效率低及成本高使其无法在大批量量产系统中使用。
CEVA 已经推出了另一种解决方案。这种解决方案可降低浮点运算的工作负荷,并在汽车应用可接受的功耗水平上获得实时的处理性能表现。随着全自动驾驶所需的计算技术的进一步发展,对关键功能进行加速的策略才能保证这些系统得到广泛应用。
利用被称为 CDNN 的框架对网络生成策略进行改进。经过改进的策略采用在高功耗浮点计算平台上(利用诸如 Caffe 的传统网络生成器)开发的受训网络结构和权重,并将其转化为基于定点运算,结构紧凑的轻型的定制网络模型。接下来,此模型会在一个基于专门优化的成像和视觉 DSP 芯片的低功耗嵌入式平台上运行。图 1 显示了轻型嵌入式神经网络的生成过程。与原始网络相比,这种技术可在当今量产型车辆的有限功率预算下带来高性能的神经处理表现,而图像识别精确度降低不到 1%。
图 1. CDNN 将通过传统方法生成的网络权重转化为一个定点网络
一个由低功耗嵌入式平台托管的输入大小为 224x224、卷积过滤器分别为 11x11、5x5 及 3x3 的 24 层卷积神经网络, 其性能表现几乎是一个在典型的 GPU/CPU 综合处理引擎上运行的类似 CNN 的三倍,尽管其所需的内存带宽只是后者的五分之一且功耗大幅降低。
下一代深度学习神经网络
汽车制造业进入神经网络领域所习得的经验不断推动技术的发展,并因此开发出了更先进的网络架构及更复杂的拓扑,如每级多层拓扑、多入/多出及全卷积网络。新推出的重要网络类型不仅可用来识别物体,也可用来识别场景,从而提供用以解决汽车领域应用程序(如自动驾驶功能)所需的图像分割。当然,中国 40 家左右的汽车制造商并不会在此道路上踽踽独行。他们会与百度等技术公司进行密切合作。技术公司是这些网络和架构发展的核心。CNN 网络生成器功能的完善也为新的网络架构和拓扑提供了支持,如 SegNet 及 GoogLeNet 与 ResNet 等其它网络结构以及高级网络层(图 2)。此外,一键启用也让预训网络转换成优化的实时网络执行更为便捷。为确保给常用的网络生成器提供支持,CDNN 框架与 Caffe 和 TensorFlow (谷歌的机器学习软件库)都有合作。
图 2网络生成器的发展为新网络层及更深的架构提供了支持
由于最新推出的嵌入式处理平台在可扩展性及灵活性上都有了很大改进,因此嵌入式部署也可以利用这些改进来完善自身。由于深度学习领域的发展越来越多样化,因此拥有一个不仅能满足当今处理需求,也具有适应未来的技术创新的灵活架构非常重要。
铺好路
第一批神经网络应用程序将专注于视觉处理,以支持诸如自动行人、交通信号或道路特征识别等功能。由于这些系统的性能不断改进,例如处理越来越大的来自高分辨率相机的数据集,因此神经网络也有望在未来的汽车中发挥更大的作用。这些作用将包括承担系统中其它复杂的信号处理任务,例如雷达模块及语音识别系统。
随着神经网络首次应用于车载自动驾驶系统,(据报道,某些国家将在 2019-2020 年型的新车辆中使用神经网络,)对同时兼具安全性及可靠性的系统的需求会越来越大。中国政府计划在 2021 至 2025 年推出自动驾驶车辆。要让此类系统具备可让客户使用的条件,汽车制造商必须同时确保其符合相关的安全标准,如 ISO 26262 功能安全性。这需要硬件、软件及系统的综合发展。
由于这些系统变得越来越复杂,因此确保系统可靠安全且能满足处理需求也成为汽车制造商所面临的越来越大的挑战。
结论
机器学习神经网络将沿着一条挑战高效处理性能的发展道路继续阔步前进。先进的神经网络架构已经显现出优于人类的识别精确性。用于生成网络的最新框架,如 CDNN2,正在推动轻型、低功耗嵌入式神经网络的发展。这种神经网络将使目前的高级辅助驾驶系统具有较高的精确性及实时处理能力。
深度学习神经网络在量产型车辆上的首次使用将限于基本的视觉识别系统,但最终会在未来为自动化程度越来越高的车辆提供支持,帮助其应对众多的复杂信号处理的挑战。
3.Cadence发布业界首款面向汽车 监控 无人机等的神经网络DSP IP;
内容提要:
• 完整独立的DSP核心,全面支持各级神经网络层
• 芯片面积不到1mm2,计算速度可达每秒1 TeraMAC (TMAC)
• 通用的可编程解决方案,为未来而生,满足不断演进的技术需求
• 为视觉设备、雷达/光学雷达和融合传感器应用度身优化
集微网消息,2017年5月4日,中国上海——楷登电子(美国Cadence公司,NASDAQ: CDNS)今日正式公布业界首款独立完整的神经网络DSP —Cadence® Tensilica® Vision C5 DSP,面向对神经网络计算能力有极高要求的视觉设备、雷达/光学雷达和融合传感器等应用量身优化。针对车载、监控安防、无人机和移动/可穿戴设备应用,Vision C5 DSP 1TMAC/s的计算能力完全能够胜任所有神经网络的计算任务。
随着神经网络应用的日益深入和复杂,对计算的要求也与日俱增;同时,神经网络的自身架构在不断更新换代,新网络、新应用和新市场也层出不穷。上述趋势之下,业界亟需一款针对嵌入式系统量身定制的高性能、通用型神经网络解决方案,不仅应该具备极低的功耗,还应拥有高度的可编程能力,以适应未来变化,降低风险。
神经网络DSP vs. 神经网络加速器
基于摄像头的视觉系统在汽车、无人机和安防领域最为常见,这种架构需要两种最基础的视觉优化计算模式。首先,利用传统视觉算法对摄像头捕捉到的照片或图像进行增强;其次,使用基于神经网络的认知算法对物体进行检测和识别。现有的神经网络加速器解决方案皆依赖与图像DSP连接的硬件加速器;神经网络代码被分为两部分,一部分网络层运行在DSP上,卷积层则运行在硬件加速器上。这种架构不但效率低下,且耗能较高。
Vision C5 DSP是专门针对神经网络进行了特定优化的DSP,可以实现全神经网络层的计算加速(卷积层、全连接层、池化层和归一化层),而不仅仅是卷积层的加速。因此,主视觉/图像DSP能力得以释放,独立运行图像增强应用,Vision C5 DSP则负责执行神经网络任务。通过移除神经网络DSP和主视觉/图像DSP之间的冗余数据传输,Vision C5 DSP的功耗远低于现有的神经网络加速器。同时,Vision C5 DSP还提供针对神经网络的单核编程模型。
“我们的很多客户都在纠结如何选择理想的神经网络平台,毕竟一款产品的开发可能耗时数年,”Cadence公司Tensilica事业部市场高级总监Steve Roddy表示。“随时在线(always-on)嵌入式系统的神经网络处理器不仅需要低功耗和较快的图像处理速度,灵活性和永不过时(future-proof)的前瞻性也必不可少。目前的平台都不够理想,客户亟需一个全新的解决方案。Vision C5 DSP通用型神经网络DSP应运而生,它集成方便、使用灵活,功耗能效较CNN加速器、GPU和CPU也更为出色。”
“现实世界中的深度学习应用数量庞大,种类繁多,对计算的要求非常苛刻,”嵌入视觉联盟(Embedded Vision Alliance)创始人Jeff Bier表示。“Vision C5 DSP作为神经网络专用编程处理器,可以帮助我们在低成本、低功耗设备上应用深度学习技术。”
Vision C5 DSP的参数与性能
依托独立引擎,Vision C5 DSP具备领先的神经网络性能:
• 不到1mm2的芯片面积可以实现1TMAC/秒的计算能力(吞吐量较Vision P6 DSP提高4倍),为深度学习内核提供极高的计算吞吐量
• 1024 8-bit MAC或512 16-bit MAC 确保8-bit 和16-bit精度的出色性能
• 128路8-bit SIMD或64路16-bit SIMD的VLIW SIMD架构
• 专为多核设计打造,以极少的资源代价获得NxTMAC的处理能力
• 内置iDMA和AXI4总线接口
• 使用与Vision P5和P6 DSP一致的经验证软件工具包
• 基于业界知名的AlexNet CNN Benchmark,Vision C5 DSP的计算速度较业界的GPU最快提高6倍;Inception V3 CNN benchmark,有9倍的性能提升。
Vision C5 DSP是一款灵活前瞻的永不过时(future-proof)解决方案,支持各类内核尺寸、深度和输入规格。Vision C5 DSP采用多项系数压缩/解压技术,支持未来添加的新计算层。与之相反,CNN硬件加速器由于程序重编能力有限,扩展能力较差。
Vision C5 DSP搭载Cadence神经网络Mapping工具链,可将Caffe和TensorFlow等映射为在Vision C5 DSP上高度优化过的可执行代码,充分发挥手动优化神经网络库的丰富功能。
Cadence正与多家早期客户展开合作。如需了解Vision C5 DSP的详细内容,请联系您的Cadence销售代表。
4.华虹宏力与华大九天再联手 国产EDA工具助力IP设计;
集微网消息,(中国,上海—2017年4月27日)全球领先的200mm纯晶圆代工厂──华虹半导体有限公司(股份代号:1347.HK)之全资子公司上海华虹宏力半导体制造有限公司(“华虹宏力”)与北京华大九天软件有限公司(“华大九天”)今天共同宣布,华虹宏力已采用华大九天的电子设计自动化(EDA)解决方案——全新高速高精度并行仿真器ALPS™完成多个模拟及嵌入式非易失性存储器IP设计项目的前后仿真/数模混合仿真并成功流片。这是双方继2013年一站式版图分析处理工具Skipper™成功合作之后的再度联手。华虹宏力的工艺平台应用广泛,涉及智能卡、微控制器(MCU)、传感器、物联网、电源管理、功率器件、新能源汽车、智能电网、智能电表、智能家居、智能硬件、无线射频等领域,以其先进的差异化晶圆代工技术,致力于为客户实现更低功耗、更小尺寸、更快面市及更佳性能的芯片产品。
华大九天全新高速高精度并行仿真器ALPS™能帮助缩短IP电路的SPICE仿真时间,还满足了传统Fast SPICE不能达到的仿真精度要求,兼顾了精度与速度性能。ADC、PLL等模拟/混合电路的后仿及混合仿真实例中,在确保精度的同时,ALPS™仿真速度较传统仿真器提升了3~5倍。ALPS™独有的精度无损Smart Matrix Solver技术,以及先进的多核并行优化技术、内存管理技术和多步长控制技术等,使仿真速度较传统晶体管级电路仿真工具显著提升。
此外,在大规模版图检视分析方面,华大九天Skipper™也为Tape-Out、PCM测试组件开发、物理版图检视分析等业务提供了有力支撑。Skipper™具有业界领先的数据读取速度,方便了超大物理数据的检视和分析,不仅支持多数据比对,且所需时间短、结果易分析。其基于Tcl的可扩展脚本,可实现业务流程的自动化,加速了Tape-Out的各项作业流程,能有效缩短制版的数据交付周期。
华虹宏力技术研发暨设计服务执行副总裁孔蔚然博士肯定了公司与华大九天在EDA工具方面的合作:“华大九天是华虹宏力合作的第一家中国本土EDA提供商,很高兴看到华大九天的True SPICE仿真工具ALPS™推进了华虹宏力的IP设计研发项目。希望双方的合作,在集成电路设计及制造领域能提供更好的服务,从而更广泛地惠及我们的客户。”
华大九天CTO(首席技术官)杨晓东先生表示:“感谢华虹宏力选择华大九天作为其IP设计业务的EDA提供商,华虹宏力作为用户提出了许多宝贵意见,帮助华大九天进一步提升产品竞争力,有力推动了本土EDA工具的发展。期待华大九天与华虹宏力更加深入而密切的合作,为本土半导体企业战略合作提供典范。”
*SPICE是一款源自于美国加州大学伯克利分校电气工程与计算机科学系的通用电路仿真软件。
关于华虹宏力
上海华虹宏力半导体制造有限公司(以下简称“华虹宏力”),由原上海华虹NEC电子有限公司和上海宏力半导体制造有限公司新设合并而成,是世界领先的200mm纯晶圆代工厂。华虹宏力在上海张江和金桥共有3条200mm集成电路生产线,月产能达15.5万片,工艺技术覆盖1微米至90纳米各节点,在标准逻辑、嵌入式非易失性存储器、电源管理、功率器件、射频、模拟和混合信号等领域形成了具有竞争力的先进工艺平台,并正在持续开发多种微机电系统(MEMS)工艺解决方案。公司总部位于中国上海,在中国台湾、日本、北美和欧洲等地均提供销售与技术支持。
如欲取得更多华虹宏力相关资料,请浏览:www.huahonggrace.com
关于华大九天
北京华大九天软件有限公司是中国最具规模的EDA/IP供应商,成立于2009年6月,是中国电子信息产业集团(CEC)下属国有控股企业,致力于提供专业的EDA软件、IP及设计服务,包括模拟/数模混合IC设计全流程解决方案、数字SoC设计优化解决方案、平板(FPD)设计优化解决方案及数模混合信号IP等。公司总部位于北京,在上海、深圳、成都、南京设有分支机构,营销网络遍及亚太、北美及欧洲。
获取更多相关资料,请访问:www.empyrean.com.cn
5.ARM 发表 Mali-C71 影像讯号处理器
ARM 近日宣布推出 ARM Mali-C71 影像讯号处理器(ISP),因应汽车图像处理所面 临的挑战,包括在极端条件下对影像进行快速的处理和分析,符合严格的汽车安 全标准设计需求。
Mali-C71 特别在设计之初即考虑到先进驾驶辅助系统(ADAS)系统单芯片(SoC)的 各式需求,包括能针对持续变化的光照以及天候条件进行调整。
以替换后视镜(Mirror Replacement)的摄影机为例,Mali-C71 提供超宽动态范围 (UWDR),在某些实例中,提供的细腻度甚至超越人眼所见的范围(最高达 24 级)。 相较之下,最好的数字单眼相机能达到约 15 级的动态范围。 它能移除摄影机拍 摄影像的噪声与处理多重曝光,制作出超宽动态范围画格,然后传送到屏幕或电 脑视觉引擎。
当摄影机用来作为 ADAS 的输入讯源,像是行人保护或驾驶人瞌睡侦测系统,就 必须符合最严格的可靠性与功能安全性标准。 透过超过 300 个专属故障检测电 路,Mali-C71 具备低延迟与先进错误侦测机制,使其能达到系统层级认证以符合 各项功能安全性标准(例如 ISO26262、ASIL D、IEC 61508 以及 SIL3)。
随着汽车产业持续加快脚步实现完全自动驾驶汽车的愿景,Mali-C71 除了提供高 质量的显示输出,让驾驶人迅速做出正确的选择,同时还为计算机视觉引擎提供可 靠的数据,在汽车处于可控制状态下做出各项安全决策。 新电子
集微网推出集成电路微信公共号:“天天IC”,重大新闻即时发布,天天IC、天天集微网,积微成著!点击文章末端“阅读原文”或长按 laoyaoic 复制微信公共号搜索添加关注。
点击⬇️阅读原文关注“天天IC”个人微信号