首页 > 技术

寒武纪:开发智能计算集群分析工具 提升系统部署效率

2024-09-25 10:39:15      Techweb   


  在当今数字化、智能化的时代,算力成为了经济发展的重要基石。国家高度重视算力产业,出台多项政策举措并实施重大工程项目,推动我国算力产业快速发展,为经济高质量发展注入强大动力。据中国信息通信研究院测算,算力投入能带动显著的GDP增长,算力指数的提高也对经济有着巨大贡献。

  中国信通院云计算与大数据研究所所长何宝宏指出,国内算力市场持续增长,智能算力规模增长迅速,占比达到30%,且近几年国内智算增速高达70%左右,成为算力经济发展的新引擎。我国的算力资源建设正从通算中心向智算中心演进。中国科学院计算技术研究所研究员张云泉认为,人工智能大模型的发展展现出新质生产力特质,但目前面临算力瓶颈,算力已成为推动经济社会发展的重要驱动力。

  寒武纪自成立以来,专注于人工智能芯片产品的研发与技术创新,致力于打造人工智能领域的核心处理器芯片,让机器更好地理解和服务人类。公司的主营业务是应用于各类云服务器、边缘计算设备、终端设备中人工智能核心芯片的研发、设计和销售,为客户提供丰富的芯片产品。目前,寒武纪的主要产品线包括云端产品线、边缘产品线、IP授权及软件。

  其中,寒武纪的智能计算集群系统业务是将自研的加速卡或训练整机产品与合作伙伴提供的服务器设备、网络设备与存储设备结合,并配备寒武纪的集群管理软件组成的数据中心集群,其核心算力来源是自研的云端智能芯片。智能计算集群主要聚焦人工智能技术在数据中心的应用,为人工智能应用部署技术能力相对较弱的客户提供软硬件整体解决方案,以科学地配置和管理集群的软硬件、提升运行效率。

  为了提升智能计算集群系统的部署效率,寒武纪训练软件平台还开发了集群分析工具,完善了故障判断逻辑,优化了故障诊断流程。据财报显示,2024上半年寒武纪成功验证了集群上的大语言模型预训练功能,实现了业界领先水平的单训练任务长时间持续稳定运行,且计算效率和能效达到了业界领先水平。

  2023年寒武纪积极参与台州、沈阳两地的算力基础设施建设项目,以训练整机产品作为核心计算设备,集成配套的软硬件,最终形成智能计算集群系统交付给客户,共实现收入60,453.27 万元。

  随着人工智能技术的不断进步,对算力基础设施的需求逐年提升。寒武纪的智能计算集群系统业务已在多个城市实现拓展,国内市场占有率已然处于第一梯队,产品的竞争力和品牌影响力与日俱增。已经完成的项目经验对寒武纪持续推进智能计算集群系统业务奠定了良好的标杆作用。

  在未来,寒武纪将继续发挥自身优势,以创新的技术和产品,为人工智能产业的发展提供强大的算力支持,助力我国经济在数字化、智能化时代实现新的飞跃。

相关阅读