当前位置:首页 > 专访 > 付斌
[导读]十年转瞬,Armv9架构终于露出庐山真面目,适用于Arm全系列芯片的Armv9架构,这次的升级瞄准的则是日益强大的安全、人工智能(AI)和无处不在的专用处理的需求。实际上,Armv9架构的推出也与正预示着行业的发展方向。凭借新架构,Arm提出了3000亿的目标。

Arm架构在如今的电子行业中可以说是无处不在。自1990年Arm公司正式成立Armv4架构到2011年Armv8架构,短短21年架构经过了5次重大升级。而Armv8意味着Arm正是从AArch32迈进AArch64,凭借强大的实力在过去的五年基于Arm架构的设备出货量超过了1000亿。

十年转瞬,Armv9架构终于露出庐山真面目,适用于Arm全系列芯片的Armv9架构,这次的升级瞄准的则是日益强大的安全、人工智能(AI)和无处不在的专用处理的需求。实际上,Armv9架构的推出也与正预示着行业的发展方向。凭借新架构,Arm提出了3000亿的目标。

Armv9的三个技术特性

根据Arm高级副总裁、首席架构师兼技术院士Richard Grisenthwaite的介绍,Armv9架构是基于Armv8既往成功的基础,并增添了针对矢量处理的DSP、机器学习ML、安全等这三个技术特性。

Armv8之所以“统治”市场十年之久,最大的升级点便是引入了64架构,即AArch64,这也是Arm版本升级最大的一次改变。除此之外,AArch64摒弃了此前的处理器模式、优先级级别等传统概念,提出了ELException level),并在兼容设计上定义了两套运行环境ESExecution state)。这些也都被Armv9所继承,可以说Armv9是集大成者,将Arm三十多年的核心完美继承下来。

矢量处理的DSP、机器学习ML处理能力提升要归功于可伸缩矢量扩展(SVE2)和矩阵乘法指令的引入。相比SVE128位矢量,SVE2可以支持多倍128位运算,最多2048位,因此才有如此魔力可以增强对在CPU上本地运行的5G系统、虚拟和增强现实以及ML工作负载的处理能力。

根据Richard Grisenthwaite的介绍,SVE2增强多项DSP和机器学习ML处理能力,例如Scatter-Gather DMA直接存储器访问,把它放到CPU架构中,能实现更多的循环,更大的DSP处理能力,从而支持更多的并行化。

安全能力提升则主要是通过Arm推出的全新的机密计算架构CCAConfidential Compute Architecture)实现,根据介绍CCA通过打造基于硬件的安全运行环境来执行计算,保护部分代码和数据,免于被存取或修改,甚至不受特权软件的影响。同时还将基于此前的TrustZone安全技术引入动态创建机密领域(Realms)的概念,机密领域面向所有应用,运行在独立于安全或非安全环境之外的环境中,以实现保护数据安全的目的。

Armv9在算力上的提升

提到架构的升级,就离不开算力这一个话题,Armv9架构能够为Arm后两代产品提供30%的性能提升。根据介绍,以智能手机等移动平台使用的Cortex-X/A系列为例,X1/A78这一代的性能相比16nm A72提升2.5倍,下一代的Matterhorn架构及Makalu架构会保持30%以上的IPC性能提升。

除了CPU性能以外,Armv9还非常重视整体的性能提升,包括降低内存延迟(从150ns降至90ns)、频率提升(从2.6GHz到3.3GHz)内存带宽(从20GB/s到60GB/s)、缓存等。

Richard Grisenthwaite强调,Arm在新一代架构Armv9上将保持这个速度,预计未来两代移动和基础设施CPU的性能提升将超过30%。,这个数据是根据业界标准评测工具来衡量的,而且这样30%的算力提升完全是凭借于本身的架构而不是借助于制程工艺来实现。

另外,随着摩尔定律正在放缓,如何进一步提升算力呢?他认为,Arm将通过最大化地提升频率、带宽、缓存大小、并减少内存延迟,以最大化CPU性能。

除了CPUArm还表示Mali GPU会增加更多高级功能,例如VRS可变帧率渲染、RT光线追踪及其他高级渲染技术等。

Armv9引发的市场竞争力

实际上,在去年Arm发布Arm® Cortex®-M55处理器和Arm Ethos™-U55神经网络处理器(NPU)两款重磅“性能炸弹”时,就已开始蓄力发展人工智能(AI)。Cortex-M55是Arm历来AI能力最为强大的Cortex-M处理器,能够大幅提升DSP与ML的性能,同时更省电。

反观行业趋势,应用开始要求提供更高的数字信号处理(DSP)性能,实时算法的复杂程度增加和浮点算法趋势下,DSP核或硬件加速单元越来越多被部署内嵌在器件之中。DSP一直影响着下一代产品创新,这是因为许多算法在字长和动态范围有着很高的要求,DSP可免去定点到浮点的转化工作加速产品上市,另外DSP浮点计算成本越来越接近定点计算。正因如此,便形成了Arm+DSP内核的黄金搭档。

另外,行业也正在将越来越多的机器学习工作负载变得更加普遍,虽然机器学习有着许多专用的加速器,不过相比来说大量的小范围机器学习的主力仍然是CPU,因此矩阵乘法指令成为关键。

在安全性能上,Arm曾在此前进行了多维度的功能增强,包括PSA认证、TrustZone等。目前PSA认证已经有有超过35个合作伙伴提供的60多种认证产品,而新推出的CCA则也将基于TrustZone提供更加安全的架构。

Armv9着眼的点来看,行业正逐渐对算力功耗平衡性和安全性能要求提高。Arm架构可用在物联网的大部分设备之上,因此对这两项要求更加吃紧。大数据时代爆炸量的信息增长下,一方面将计算分成了多个维度,另一方面将会对数据安全提出更高的要求。

根据Arm的介绍,搭载ARMv9处理器的芯片最快在2021年年底就会面世,物联网发展日趋成熟,这个时间点恰好提升竞争力的好时机。市场或将拥有追求极致计算性能的高端产品、超低功耗的省电高手、主打安全可靠的产品。而Armv9经过架构的更新,能够从底层和非制程方向进行大改革,相信能为市场带来新的竞争力。

而在广为受关注的国内授权问题上,Arm强调:“Arm既有源于美国的IP,也有非源于美国的IP。经过全面的审查,Arm确定其Armv9架构不受美国出口管理条例(EAR)的约束。Arm已将此通知美国政府相关部门,我们将继续遵守美国商务部针对华为及其附属公司海思的指导方针。

换一批

延伸阅读

[芯鲜事] 徐直军:美国制裁华为,是造成全球缺芯的主要原因

徐直军:美国制裁华为,是造成全球缺芯的主要原因

4月12日,在华为分析师大会上,华为轮值董事长徐直军表示,美国制裁华为使得全球企业,特别是中国企业和其它供应链上的芯片企业都出现了恐慌性备货,最终导致全球半导体供应紧张。 “过去两年,美国对华为进行了三轮制裁,这对华为的伤...

关键字: 华为 芯片 半导体

[IT葡萄皮] 华为智能运维服务,用能力定义场景化运维

一台计算机: 装进大机箱里的叫台式机;扩展性好,性能高。 放在小机壳里叫笔记本;更具便携性,满足多种场景。 放在加固手提箱里叫三防电脑;能够适应恶劣工况,皮实耐用。...

关键字: 运维 华为

[21ic观察] 徐直军:华为将推子品牌汽车 打上“华为inside”标识

华为不造车,要帮车企造好车。这是华为在汽车产业一直对外宣称的定位。 4月12日,华为轮值董事长徐直军在全球分析师大会上透露,华为已经与三家车企合作伙伴进行深度合作打造三个子品牌,今年第四季度打上“华为inside”标识的智...

关键字: 汽车 华为

[21ic观察] 重磅!NVIDIA发布自主CPU

重磅!NVIDIA发布自主CPU

在普遍认知中,NVIDIA是一家生产显卡的公司。实际上,除了GPU,NVIDIA在CPU的“野心”从未停止过。 昨夜,GTC 2021开发者大会如期召开,似乎碍于“缺芯少货”的老黄,容貌又增添几分沧桑。 而这次,黄仁勋重磅宣...

关键字: NVIDIA ARM

[电子情报局] 华为:优化产业组合 用产业韧性应对外部挑战

华为:优化产业组合 用产业韧性应对外部挑战

[中国,深圳,2021年4月12日] 华为公司第18届全球分析师大会12日在深圳开幕。本届大会以“构建万物互联的智能世界”为主题,400多名行业分析师、财经分析师、各行业意见领袖及媒体现场参会,同时来自全球的分析师与媒体也通过线上与会,...

关键字: 徐直军 华为

付斌

102 篇文章

关注

发布文章

技术子站

关闭