• Arm发布全球首个Armv9边缘AI计算平台
  • 发布于 1天前
  • 34 热度
    0 评论
当所有人的目光都还聚焦在云端那些巨大的数据中心时,一场新的技术革命正在我们身边悄然发生。这就是边缘计算与AI的结合,一个正在推动智能设备革新的关键力量。在这片蓬勃发展的新蓝海里,Arm,这家长期统治我们手机芯片架构的巨头,扔出了一颗重磅炸弹——Armv9边缘AI计算平台。这个平台的核心,是全新的Cortex-A320 CPU和Ethos-U85 NPU,专为物联网应用而生。听起来有点技术宅?说白了,它的目标就是让身边的各种小设备,能够在本地运行超过10亿个参数的AI模型。

真正的AI战场,在你看不见的地方
你可能没意识到,边缘人工智能(Edge AI)这个市场,正在以一种近乎疯狂的速度增长。根据全球市场洞察(Global Market Insights)的一份报告,2024年全球边缘AI市场规模已经达到了125亿美元。这还只是个开始,报告预计在2025到2034年间,这个数字的复合年增长率将达到惊人的24.8%,到2034年,市场规模会暴涨到1094亿美元。

这股热潮背后,是各行各业对边缘设备越来越强的依赖,以及对AI技术源源不断的投资。它已经不是一个PPT上的概念,而是渗透到了我们生活的方方面面。医疗保健行业是冲在最前面的,2024年,它一家就占了整个市场收入的43%。这不难理解,无论是实时病人监控、医疗影像分析,还是AI辅助诊断,这些场景都要求AI能够快速决策,帮助医生改善治疗结果。除了医疗,制造业、金融、零售、物流,几乎所有行业都在拥抱边缘AI。

从技术上看,这个市场由软件、硬件和服务三部分构成。2024年,软件是绝对的主角,占了51.7%的收入。毕竟,AI模型优化、实时数据处理、边缘分析平台,这些都是软件的活儿。当企业们争先恐后地把AI整合进业务,软件在模型部署、数据安全和系统更新中的作用就变得无可替代。

地域上,北美是当之无愧的领头羊,2024年占据了全球市场30%以上的份额,其中美国预计到2034年将达到200亿美元的规模。而在欧洲,德国因为严格的数据隐私规定,也对边缘计算青睐有加。视线转回亚太,中国在政府AI战略和5G、智能基础设施的大力投资下,市场增长也异常迅猛。

推动这一切的,是几个关键的技术趋势。首先是TinyML,也就是在超低功耗的微控制器上跑机器学习,让小小的电池设备也能在本地运行AI,不再依赖云。其次是AI和物联网(IoT)的融合,催生了海量的AI驱动的物联网设备。最后,就是边缘AI硬件本身的飞速发展,各种新的处理器、AI加速器和神经处理单元(NPU)层出不穷,就是为了更高效地处理机器学习任务。

手机霸主Arm,转身杀入新战场
说到Arm,大多数人想到的可能还是手机。没错,这家全球半导体IP设计的领导者,长期以来都是移动处理器领域的绝对霸主。全球已经有超过1800亿颗Arm芯片出货,这让它成了移动设备和物联网系统里事实上的标准。但时代变了,随着AI和边缘计算的需求暴增,Arm正积极地把触角伸向一个更广阔的天地。

Arm公司CEO Rene Haas在财报电话会议上说得非常直白:「从智能家居传感器和工厂里的智能传感器,到世界上最先进的AI超级计算机,AI工作负载正在各地部署。这正在推动对不仅性能强大而且能源高效的计算前所未有的需求。」他甚至有点凡尔赛地强调,Arm提供了「唯一的计算平台」,开发者可以在上面设计驱动各种应用的芯片。

这话不是吹牛。看看Arm的收入构成,虽然智能手机处理器依然贡献了45%的特许权使用费,但剩下的37%已经来自物联网、汽车芯片、云和网络等其他领域。和过去一半以上收入都靠手机业务相比,Arm的业务多元化已经卓有成效。Arm的这次战略转型,不是一时兴起,而是对市场趋势的深刻洞察。AI应用从云端向边缘迁移,已经是大势所趋。好处是显而易见的:数据在本地处理,省电;减少对网络带宽的依赖;延迟极低,对于自动驾驶、工业自动化这种分秒必争的应用至关重要;数据不出本地,隐私和安全也更有保障。

正是看透了这一切,Arm近些年才在边缘AI领域疯狂下注。Arm扔出了他们的「王炸」——全球首个Armv9边缘AI计算平台。这不仅是Arm在边缘AI领域的重要里程碑,更是给整个行业划下的一道分水岭。这个平台以全新的Arm Cortex-A320 CPU和领先的边缘AI加速器Arm Ethos-U85 NPU为核心,能支持运行超过10亿参数的边缘AI模型,为边缘设备的普及提供了强有力的技术支撑。

Arm的看家本领,到底有多强?
Armv9边缘AI计算平台,这个听起来有点拗口的名字,代表了当前边缘AI技术的顶尖水平。它把全新的超高效率Armv9 CPU——Cortex-A320,和支持Transformer运算的Ethos-U85 NPU整合在了一起,打造出全球首个专门为物联网优化的Armv9边缘AI平台。

先说Cortex-A320。作为Armv9架构的最小实现,它给超高效率的Cortex-A处理器带来了安全和机器学习的最新创新。和上一代的Cortex-A35 CPU比,它的机器学习性能最高能提升10倍,纯粹的标量性能也提升了30%。这背后是Armv9.2-A架构的功劳,它不仅提供了加速机器学习的SVE2(可扩展向量扩展2),还内置了像PAC、BTI和MTE这些听起来很酷的先进安全功能,就是为了保护你的数据。软件兼容性也没得说,它专为Linux这类富操作系统开发,开发者可以继续用他们熟悉的软件和工具,大大降低了开发门槛。

再看Ethos-U85 NPU。这是Arm的第三代NPU,专为边缘AI推理而生。它的性能可以伸缩,乘加器(MAC)单元可以从128个扩展到2048个,在1GHz频率下能提供从256 GOP/s到4 TOPs的性能,满足不同应用的需求。能效也比上一代提升了20%,这对于靠电池供电的边缘设备来说简直是福音。更重要的是,它原生支持Transformer网络,这意味着它能高效处理生成式AI模型,让你的边缘设备也能拥有强大的AI能力。

光有硬件还不够,Arm还端出了一道软件大餐——KleidiAI。这是一个高度优化的软件函数库,专门在Arm CPU上加速AI功能。它能和Arm架构的Neon、SVE2等特性协同工作。效果怎么样?在Llama.cpp上跑微软的Tiny Stories数据集时,KleidiAI给新的Cortex-A320带来了高达70%的性能提升。它还无缝整合进了像Llama.cpp和ExecuTorch这些主流的物联网AI框架里,加速了Meta Llama 3和Phi-3这些关键模型的性能,让开发者用起来得心应手。

强敌环伺,Arm凭什么这么自信?
在边缘AI芯片这个赛道上,Arm并不是唯一的玩家。开源的RISC-V架构、传统的x86架构,还有各种专有的AI加速器,都在虎视眈眈。但通过对比,我们能看清Armv9平台的底气在哪。

先看和RISC-V的对决。RISC-V作为开源的后起之秀,近年来越来越火。但和它相比,Arm的优势依然明显。首先是纯性能,Arm处理器还是领先的,比如ARM的Cortex-A76在单线程性能上就略胜于SiFive的P670。更别提ARMv9处理器比上一代性能提高了约30%,能效提高了50%。其次是生态系统,Arm经营多年,拥有一个成熟且庞大的生态,超过1800亿块的出货量不是开玩笑的。RISC-V虽然发展很快,但生态还比较年轻。最后是能效比,ARM架构天生就注重节能,这是它在移动和嵌入式领域的立身之本。当然,RISC-V的优势在于定制化和开放性,对于某些特殊应用场景很有吸引力。

再来看和老牌霸主x86的较量。x86在PC和服务器市场是绝对的老大,但到了边缘AI领域,Arm的优势就体现出来了。Arm基于RISC(精简指令集),天生就比CISC(复杂指令集)的x86更省电。在边缘设备里,功耗往往是决定生死的关键。此外,Arm的产品线非常广,从微控制器到高性能服务器,能满足各种性能需求。最关键的是,Arm这几年在AI优化上投入巨大,专门的Ethos系列NPU和KleidiAI软件库,让它在处理边缘AI任务时更加得心应手。

为了看得更清楚,我们把它们放在一张桌子上比一比:

注:数据来源于Arm官方发布及公开技术文档

从这张表里不难看出,Armv9边缘AI计算平台在性能、能效、安全和软件生态上,特别是在边缘AI这个特定的应用场景里,确实有它的独到之处。

不是一个人在战斗,Arm的朋友圈有多豪华?
一个成功的技术平台,光靠自己技术牛是不够的,还得有一帮兄弟撑腰。Arm深谙此道,在推出Armv9平台的同时,也拉起了一个豪华的边缘AI生态朋友圈。Arm拥有全球最大的开发者生态之一,超过2000万名活跃的Arm开发者,这是创新的源泉。更重要的是,Armv9平台一发布,就获得了包括亚马逊AWS、西门子、瑞萨电子、研华科技和Eurotech在内的多家行业巨头的力挺。这些来自不同行业大佬的站台,无疑给Arm的边缘AI战略注入了一针强心剂。

Armv9平台的推出,正在让AI应用的可能性遍地开花。它能支持在各种设备上运行大型语言模型(LLM)和小型语言模型(SLM),让智慧决策更接近数据源头,不仅延迟更低,隐私也更有保障。

在智能城市里,边缘AI能实时监控交通,优化信号灯,还能让智能相机及时发现安全隐患。在工业自动化领域,它能预测设备故障,进行质量控制,让机器人更聪明。在智能家居里,你的家电会更懂你,语音助手交互更自然。在医疗健康领域,它能实时监测病人体征,辅助医生诊断,甚至加速新药研发。

Armv9边缘AI计算平台的发布,像是在平静的湖面上投下了一块巨石。它不仅是Arm公司战略转型的重要一步,更是整个边缘AI行业发展的催化剂。
用户评论