2023-11-20 14:59:33 西盟科技资讯
近日,在广东省政府与中国电信联合主办的2023数字科技生态大会上,联想联合寒武纪共同展示了搭载寒武纪GPU芯片的联想SR660 V2服务器。据介绍,该款服务器最多可配备12个PCIe 4.0插槽、两个OCP 3.0插槽,可支持最多四个300W GPU, 实现了更高的可扩展性。值得注意的是,该款服务器能够完整支撑政府、垂直行业,以及大中型企业和IPDC等客户全业务负载类型的需求,覆盖商业决策、虚拟化、混合云基础架构、业务协同等主流场景。
作为智能芯片领域全球知名的新兴公司,寒武纪能提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件。此前,寒武纪2023年半年度报告提及在行业客户中,寒武纪依托于近年来持续拓展和深耕的成效,在互联网、运营商、金融、电力能源等多个行业及客户中进行了广泛的业务部署与落地。
此外,寒武纪董事长、总经理陈天石在与投资者互动时表示:基于云端产品的优势,针对最近兴起的大模型领域,优化了寒武纪产品在AIGC及大语言模型领域的性能,并与多个行业客户及ISV推动了技术和产品合作。此外,寒武纪的第六代智能处理器微架构和指令集正在研发中。新一代智能处理器微架构及指令集将对自然语言处理大模型和推荐系统的训练推理等场景进行重点优化,将在编程灵活性、能效、功耗、面积等方面提升产品竞争力。
近日,寒武纪正式宣布了思元(MLU)系列云端智能加速卡与百川智能旗下的大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面适配,寒武纪思元(MLU)系列产品性能均达到国际主流产品的水平。
寒武纪的思元(MLU)云端智能加速卡支持多种数据位宽、超大内存容量和高速内存带宽等产品优势,加上寒武纪自研的BangTransformer算法加速库,硬件和基础软件平台充分协同,适配过程中,满足了百川大模型对加速卡计算、通信和能效等多方面需求,显著加速了大模型从训练到部署的全部流程。