2026-05-23 17:16:20 中华网
近日,紫光股份旗下新华三集团于 NAVIGATE 2026 领航者峰会期间,正式发布新一代 AI 智能云,以 CloudOS 为核心底座,依托通智融合架构、智算加速引擎、数智融合 MaaS 平台三大核心能力,直击异构算力分散、调度低效、训推成本高、行业落地难等痛点,为百行百业打造全域统一、高效稳定、可信开放的 AI 算力底座,助推 AI 产业化与产业智能化升级。

当前,AI 全面渗透百行百业,算力已成为数字经济的核心生产要素,但算力的高效运转面临着来自管控、资源和效能的三方面的挑战:如何弥合多厂商算力芯片的架构差异,降低使用门槛?如何提升资源利用率?如何深挖硬件潜力,最大化释放算力性能?新华三认为,只有通过系统性的整合和优化,才能实现更大规模的资源池、更均衡的算力调度和更高性能的训推服务,真正实现 “每一份算力随需而动”。

通智融合架构:一云多芯,资源高效供给与智能调度
通智融合架构是新华三新一代 AI 智能云的核心根基,打破通用算力与智能算力长期割裂的行业格局,实现通用算力与智能算力统一管控、统一调度,搭建全域融合的混合计算底座。平台将传统业务通用算力资源与大模型训推智能算力资源纳入一体化管理,兼容 100 + 款 GPU、50 + 款 CPU,最大节点规模可达 10 万 +。

在通用算力的管理上,以 CPU 为核心分配粒度,承载业务事务处理,提供云主机、通用网络、全类型存储及等保安全等服务;在智能算力的管理上,则以 GPU 为核心分配粒度,针对大模型训推的预填充(Prefill)、解码(Decode)阶段,配套提供 CCE 容器、RoCE 网络、并行文件存储与算力安全能力。
新一代 AI 智能云支持多元异构统一纳管,多元兼容国内外主流芯片,覆盖商用及国产算力生态。依托全域资源池化,实现算、存、网资源统一编排,结合智能柔性调度与亲和性拓扑感知,依据实时负载智能匹配最优算力单元。
从芯片纳管、算力调度到存算网协同,通智融合架构彻底解决算力碎片化、资源利用率低、协同效率差的行业难题,为 AI 业务提供坚实的底层支撑。
智算加速引擎:软硬协同,推理效率大幅提升
为全面提速 AI 模型开发与应用落地,新一代 AI 智能云内置智算加速引擎,以操作系统异构内存池化、异构算子融合加速、拓扑感知与通信库优化及推理框架优化四大技术,大幅提升推理效率,实现模型浮点运算利用率(MFU)82%+,助力高并发场景下实现更高的 Token 总吞吐量。

●操作系统异构内存池化:将本地内存和 CXL 统一编址,实现 CXL 全局内存池化与异构 GPU 显存池化,搭配智能 NUMA 调度机制,跨节点可直接访问远端内存,内存利用率可达 90% 以上,有效减少跨节点数据通信开销,整体推理效率提升 20% 以上。
●异构算子融合加速:对算子级、张量级、指令线程级做多粒度流水线编排优化,融合不同粒度算子并完成编译优化与流水线编排,适配专用矩阵运算单元硬件加速,算子性能可提升 20%-50%,显著提升并行计算效率。
●拓扑感知与通信库优化:自动构建节点间 CPU、网卡和 GPU 物理连接拓扑,依托云算网协同与低延时集合通信库,实现通信最优路径导航与全域负载分担,通信算子卸载降维算力开销,整体通信时延可降低 50%。
●推理框架优化:精细设计计算和通信任务配比,提升计算与任务并行效率,支持 PD 动态在离线混部及 PD 资源动态配比,结合算力细粒度切分与亲和性调度,有效降低通信开销、拉升模型浮点运算利用率,显著提升推理速度与并发吞吐。
数智融合 MaaS 平台:数智赋能,降低行业 AI 应用落地门槛
数智融合 MaaS 平台作为新华三新一代 AI 智能云的上层能力载体,依托全域智算工具链、多模数据工程、全谱系模型服务三大核心能力构建完整服务体系,同时搭载丰富 AI 智能体相关能力,大幅降低百行百业 AI 应用开发与落地门槛。平台可提供 100+MaaS 服务支撑,搭配完善的全域智算工具链,覆盖大模型从数据处理、模型训练、调优推理到业务部署的全流程环节,为开发者提供一站式研发支撑。
依托专业的多模数据工程能力,可高效完成多类型数据的清洗、标注与优化处理,为大模型应用筑牢数据根基。同时平台具备全谱系模型服务能力,兼容多款开源与行业大模型,能够适配政务、金融、交通等不同场景的业务需求,支撑海量模型调用与亿级 Token 吞吐量,助力企业无需底层技术深耕,即可实现分钟级应用构建。
依托云数智一体化能力,新华三 AI 智能云有效解决了传统管理碎片化、效率低、成本高的痛点,构建起覆盖生成、调度、优化、管控全流程的 Token 运营体系。目前,新华三 AI 智能云已服务超万家客户,成为各行业 AI 转型的核心数智底座:在某省级政务云,通过通智融合架构,纳管 5 家 8 款国产算力,承载 200 个政务 AI 应用,模型发布 50 + 款,支撑日均调用模型 100 万次,日均亿级 Token 吞吐量,有效支撑民生业务落地;在某大型智算中心建成近 3000P 总算力的多元异构智算云,通过新华三智算加速引擎,对各种模型框架和芯片硬件进行性能加速,模型推理效率相比以前提升 40%+。
AI 时代,云不仅是算力载体,更是创新引擎。新华三将持续深耕云智原生技术,以新一代 AI 智能云为核心,强化通智协同、算力调度、AI 使能与行业适配能力,携手生态伙伴释放 “算力 × 联接” 倍增效应,助力百行百业加速 AI 落地,共同塑造智能时代数字新价值。