首页 > 技术

寒武纪思元370通过芯粒技术适配多样场景需求

2022-11-02 14:49:41      北方网   


  思元 370 是寒武纪首款采用 chiplet(芯粒)技术的 AI 芯片,应该也是国内首颗 chiplet AI 芯片。基于台积电 7nm 制程工艺,整体集成了 390 亿个晶体管,最大算力达到 256TOPS(INT8),这一数据是寒武纪第二代产品思元 270 算力的 2 倍。

  凭借寒武纪最新智能芯片架构 MLUarch03,相较于峰值算力的提升,思元 370 实测性能表现非常亮眼:同功率性能超过 T4 两倍还多,完成同样的任务,功耗可以是 A10 的一半。

  此外,寒武纪还基于思元370智能芯片的技术,通过Chiplet(芯粒)技术,灵活组合产品的特性,适配出符合不同场景需求的三款加速卡,包括:MLU370-S4、MLU370-X4和MLU370-X8。

  具体来说,MLU370-S4为半高半长单槽位加速卡,板卡功耗为75W,可面向机器视觉/推理任务,适合于对计算密度要求较高的数据中心场景。

  而MLU370-X4为单槽位150W全尺寸加速卡,可提供256TOPS(INT8)推理算力和24TFLOPS(FP32)训练算力,同时提供FP16、BF16等多种训练精度,主要面向互联网行业等推理任务或训推一体场景,适合于对单卡算力需求较高的应用场景。

  MLU370-X8则采用双芯思元370配置,为双槽位250W全尺寸加速卡,可提供24TFLOPS(FP32)训练算力和256TOPS(INT8)推理算力,同时提供丰富的FP16、BF16等多种训练精度,主要面向对算力和带宽要求较高的训练任务。在业界应用广泛的YOLOv3、Transformer等训练任务中,8卡计算系统的并行性能平均达到350W RTX GPU的155%。

  总而言之,寒武纪在同样的研发费用之下,满足了更多元的市场需求。

  据了解,寒武纪是智能芯片领域全球知名的新兴公司,主营业务是各类云服务器、边缘计算设备、终端设备中人工智能核心芯片的研发、设计和销售,通过向客户提供芯片及加速卡产品、训练整机、智能计算集群系统、IP授权及软件获取业务收入。

  成立以来,寒武纪一直根据市场和客户的需求,加强研发创新投入力度,持续升级迭代云边端系列化产品及基础系统软件平台,丰富公司的产品矩阵,以适应不同的人工智能应用场景。

相关阅读