首页 > 技术

Arm 全面设计助力 Arm 架构生态发展,构建可持续 AI 数据中心

2024-10-18 13:54:36      中关村在线   


  新闻重点:

  ·Arm全面设计(Arm Total Design)生态项目推出一年来,成员规模翻倍,推动了全球芯片创新

  ·Arm、三星晶圆代工厂(Samsung Foundry)、ADTechnology和Rebellions合作开发基于Neoverse CSS V3的AI CPU芯粒(chiplet)平台,应用于云、高性能计算(HPC)以及人工智能/机器学习(AI/ML)训练和推理

  ·安国国际科技(Alcor Micro)和Alphawave推出基于台积公司工艺的全新芯粒,用于打造可持续AI数据中心

  近日,Arm控股有限公司 (纳斯达克股票代码:ARM,以下简称Arm) 分享了Arm全面设计生态项目推出一周年后的最新动态:参与企业已迅速扩展到近30家,涵盖了从IC设计到晶圆代工服务等各项专业能力,最新加入的企业包括安国国际科技、神盾公司(Egis)、熵碼科技(PUFsecurity) 和SEMIFIVE。此外,通过该生态项目,Arm、三星晶圆代工厂、ADTechnology和Rebellions正在联手向市场推出AI CPU芯粒平台,面向云、HPC以及AI/ML训练和推理工作负载。

  Arm基础设施事业部营销副总裁Eddie Ramirez表示:“随着AI算力需求的增长,确保开发者以高性能、低功耗且易用的方式,在全球应用最普及的计算平台上轻松运行创新成果至关重要。Arm计算子系统(CSS)和Arm全面设计正助力软硬件的快速进步,推动AI开发。我们已迈入工程创意发展的时代,Arm正提供必要的工具和技术,以推动AI和芯片领域的创新。”

  全新Arm架构解决方案推动AI数据中心的可持续发展

  Arm全面设计带动了全球合作,促成了多个以CSS为核心的生成式AI计算解决方案诞生。其中一个绝佳的例子是由Arm、三星晶圆代工厂、ADTechnology和Rebellions联合推出的AI CPU芯粒平台。该平台专门针对云、HPC以及AI/ML训练和推理工作负载,结合了Rebellions的REBEL AI加速器和搭载Neoverse CSS V3的ADTechnology计算芯粒,并采用三星晶圆代工厂2nm全环绕栅极(GAA)先进工艺技术,带来出色的性能和能效,预计可为生成式AI工作负载(Llama3.1 405B参数LLM)带来2-3倍的能效优势。

  三星电子副总裁兼代工业务开发负责人Taejoong Song表示:“AI和HPC设计需要采用具有最高性能、高晶体管密度和高能效的技术解决方案。三星晶圆代工厂的2nm GAA工艺专为满足严格的HPC和AI设计要求而设计,我们很高兴能够利用Arm CSS的灵活性和Arm全面设计的优势来打造AI CPU芯粒平台,进一步推动超大规模企业和云服务提供商采用我们的尖端技术和设计解决方案。”

  这个合作范例充分体现了Arm全面设计和基于标准计算子系统在加速AI芯片开发方面的独特价值。通过集成Arm优化的EDA工具、全球设计专业知识和晶圆代工服务合作关系,Arm为AI加速器设计人员简化了集成流程。随着AI工作负载的快速演进,紧密耦合CPU计算对于支持完整的AI堆栈至关重要。数据预处理、编排、数据库增强技术(例如检索增强生成(RAG))等都能受益于Arm Neoverse CPU的性能效率。Arm已经在CSS中融入了对这些要求的支持, 并通过Arm全面设计生态项目从中受益。

  专为AI基础设施打造的新标准

  CSS和Arm全面设计正在帮助打造可持续AI数据中心的硬件基础。Arm全面设计已经在加速开发基于Arm架构的测试芯片以及由Neoverse N系列或V系列CSS驱动的芯粒产品。通过提供优先获取最新CSS的广泛途径,我们降低了行业准入门槛,打造了从云端到边缘的多样化芯粒解决方案,并加速了开发速度。

  近日,Alcor Micro宣布他们正在构建由CSS驱动的芯粒,针对AI/ML训练和推理用例。Alphawave近期也宣布推出基于CSS的先进计算芯粒,面向AI/ML、HPC、数据中心和5G/6G应用。这些基于Arm架构的芯粒充分展现了Arm生态系统独有的多样性、灵活性和全球化。

  此外,Arm全面设计合作伙伴(包括Alphawave、Cadence和proteanTecs等)正通过CSS在先进节点上验证第三方IP产品,以确保其符合Arm规范和标准。这意味着合作伙伴可以在先进节点上构建基于CSS的定制芯片,并获得无缝的开箱即用的软件体验。

  这种软件就绪程度始终是释放AI潜力的关键。30多年来,Arm不断进行资源投入,以确保在Arm平台上运行的软件“开机即用”。如今,所有主流框架和操作系统均在Arm架构上运行。对于Arm全面设计生态项目而言,这意味着Arm合作伙伴推向市场的多样化芯片解决方案,都能充分利用同样充满活力且高度整合的软件生态系统。这项持续投入的最新成果之一是Arm Kleidi技术的推出,该项技术被集成到PyTorch和Llama.cpp等开源项目,优化了Arm平台上的CPU推理。这对于Arm全面设计合作伙伴来说尤为重要,他们无需依赖专用的加速器,即可通过CSS为边缘AI计算打造芯粒。

相关阅读