2026-05-27 10:10:12 中华网
【中国,北京,2026年5月22日】以“心怀挚爱,共绽光芒”为主题的鲲鹏昇腾开发者大会2026(KADC2026)在北京中关村国际创新中心成功举办。在鲲鹏开发者峰会上,华为公司Fellow、ICT操作系统副首席科学家胡欣蔚发表了《根技术探索,引领科技前沿——Agentic AI负载下智能底座重塑》的主题演讲。

华为公司Fellow、ICT操作系统副首席科学家 胡欣蔚
以下为胡欣蔚主题演讲全文
各位领导、各位专家:
大家下午好!我是来自华为的胡欣蔚,很高兴今天下午在这里有机会给大家分享一下我们关于Agentic AI的根技术的一些思考。
过去半年多,AI领域特别是Agent领域发生了巨大变化。这个变化对于做操作系统、做CPU软件栈的我们来说,到底意味着什么?
开环的控制是不稳定的,Agent让AI形成闭环
我们把AI落地分为四个阶段,它们并非替代关系,而是在技术实现难度上有明显差异。第一阶段是感知AI(Perception AI),通过大模型实现从规则驱动到数据驱动的理解,大多数工作负载运行在AI加速器上。第二阶段是生成式AI(Generative AI),基于模型生成内容,各类聊天机器人、Copilot辅助生成代码,这至今仍是AI产业商业落地的主力场景。
我们之前就意识到,如果AI没有Agent或相应辅助手段形成闭环控制,那开环运行必然是不稳定的。因此我们判断,后续一定会出现把AI与数字世界连接起来的场景。过去半年多,这一趋势已愈发明显,也就是现在备受关注的Agentic AI(第三阶段)。
Agentic AI与以往最大的区别在于:AI不再单纯做生成,而是经过思考后产生行动轨迹,交由CPU执行,并基于执行反馈进行下一步规划。这个过程中,CPU如何参与AI,为我们带来了新的机遇与挑战。
CPU从边缘走向中央,成为AI集群规划的独立约束
在Agentic AI场景下,我们至少看到两个明显的技术演进机会。一是单智能体形态:在个人PC或计算设备上启动Agent,需要智算与通算协同,由GPU/NPU负责“思考”,CPU负责“行动”,二者协同打破时延墙。另外,随着Agentic AI在企业场景逐步落地,我们认为多智能体协同也将成为重要演进方向,这涉及CPU调度和内存等核心问题,必须由CPU和操作系统来解决。这就需要通用计算、智能计算、网络、存储(通智网存)深度协同,构筑一体化基石,开创Agentic AI的新范式。
当前,CPU事实上已经成为AI集群容量规划中的一个独立约束。根据TrendForce近期调研,在传统大模型业务中,CPU与GPU的算力规划比例已出现显著调整。业界还有更激进的观点,认为CPU在整个AIGC中的占比需要达到1:1甚至更高。之所以如此,是因为Agent执行复杂任务时,会出现大量异步分支和常驻流,这些天然适合CPU处理;而且任务越多,对CPU算力的要求也越高。因此,CPU成为AI集群容量规划的独立约束,在行业内已经形成共识。
内存与存储成为Agent记忆层,异构融合是理想底座
我们把Agentic AI的演进做一个对比。去年初,Agent的讨论还集中在Prompt Engineering——如何更好地编写给模型输入,让模型尽量一次做对,这时负载主要在NPU上。随后演进到Context Engineering,从单轮走向多轮,CPU承担了更多辅助工作:内容经过拼接后交给NPU推理,结果需要解析并更新到内存中。今年初,业界提出Harness Engineering概念。我们可以把这个阶段看做NPU和CPU的角色发生了置换:此前是CPU为NPU服务、准备数据,现在NPU变成了CPU的Worker,由CPU来调度NPU做什么,吞吐、时延、同步等问题就成了瓶颈。
每一步演进都带来性能影响因素的改变。控制流复杂度大幅提升,从基本静态变为完全动态,CPU需要处理的任务极多,包括图调度、分支依赖、回调、调试等,更多瓶颈从NPU逐步转移到CPU。同时,Tool Call和更多外部系统进入了Agent执行的主路径,这不仅对CPU,更对操作系统提出了关键诉求——每一次工具调用都意味着跨进程交互,需要启动新进程执行新任务,操作系统由此进入了Agent业务主路径。特别需要注意的是,Agent是循环执行过程,单条路径耗时不长,但在紧密循环中会被累积效应放大。高并发场景下,CPU动态能耗占比可达整个系统的40%以上。总体来看,随着Agentic AI演进,系统热点分布已发生显著变化,CPU从舞台边缘走到了舞台中央。
从另一个角度看,CPU侧的内存和存储正在成为Agent的记忆层。Agent与以往对话的一大区别,在于每一轮都会添加上下文。长期运行的Agent,其上下文窗口通常会占到模型支持窗口的50%左右,未来超百万级上下文也可能成为标配。传统上把全部推理过程都放在NPU侧,当前既不现实也不经济。通过协同片上内存与CPU侧内存,把最热、计算直接需要的数据放在NPU的片上内存上,Host侧放置预取缓存,更冷的数据存放于SSD,并由CPU实施统一管理,就能将DDR、SSD与片上内存融为一体,成为Agent真正统一的记忆体。
我们之前提出了异构融合的思路,认为操作系统应该走异构融合的道路,让CPU和NPU从底层就实现协同。基于openEuler超节点的异构融合OS,在池化设备管理、异构融合核心子系统和系统高阶服务等方面都做了相应适配。由于“通智网存”的协同,它自身就是适合Agent运行的底座。当前系统已能够:通过主机自适应隔离与硬件亲和,解决Host Bound性能问题,提升推理吞吐;通过remote fork实现全内核快照和状态回溯跳转,提升沙箱启动性能;通过内存借用、池化、共享等技术,在超节点内实现无序列化直接访问,加速KVCache访问时延。但是我们觉得还有更多的价值空间有待探索,在这里也给大家做个分享。
沙箱、记忆、安全三大能力需操作系统原生集成
当前大家在构建Agentic AI场景时,都会面临沙箱选型问题。业界技术选项很多,有操作系统容器、MicroVM、用户态内核、语言沙箱等。这并非技术路线难以取舍,而是因为Agent使用沙箱的场景本身就多种多样。比如,当运行类似OpenClaw的个人助手时,Agent是长时间运行,过程中需要高度灵活性,给它一个VM独享完整环境是合适的选择。反之,当沙箱用于强化学习中的编码任务,则需要尽量轻量、快速启动、快速重置、短时间内完成的形态。因此,现有各类沙箱技术都有其存在价值。对操作系统而言,我们不做选择题,而应兼容并包,通过提供统一的沙箱SDK,将不同沙箱方案抽象统一,构建系统层面适配多元场景、可灵活定制的竞争力。
但从追求根技术的角度,我们不会停留在沙箱统一上。一方面,所有Agent在运行时,资源重复率非常高。能否基于超节点的技术特点,把不同沙箱间的资源重复降到最低,提升部署密度、降低使用成本?这正是Conch的首要研发方向,依托超节点原生能力实现资源自动去重,显著提高沙箱部署密度。
更重要的是,我们认为Agentic AI发展必将带来一个新趋势——Agentic Scaling。如同DeepSeek等模型在输出结果时进行的内部反复思考与迭代,即Test-time Scaling,我们预期,将来会出现运行在CPU和通用计算算力上的Agentic Scaling。当模型解决问题时,不再仅靠“脑中”反复推演,而是通过不断试错来实现。系统如何为模型提供一个安全、可控的试错基础设施?这就是Conch的核心价值所在:它能在AI尝试不同求解路径时,快速做快照、快速回滚,并将状态影响限制在一定范围内,避免错误扩散到全局。这一技术是我们面向未来Agentic Scaling的重要基础。
在记忆系统方面,我们提出将其做成操作系统原生的能力。当前,操作系统的数据存储系统已与记忆和语义感知强相关——越来越多数据直接以文本形式存放在文件系统,通过高保真读取来重构记忆。操作系统与文件系统在这里有极好的协同空间。通过操作系统原生记忆,可以解决上下文过载带来的Token开销、长任务中关键信息丢失导致的意图漂移,以及NPU与CPU间管理粗放造成的资源浪费。记忆能力虽然单独构建也能取得效果,但正如Windows将图形界面从外挂纳入系统内核带来质的飞跃,我们认为将其沉淀为操作系统原生能力后,也将迎来跃升,这是我们希望为行业提供的更好记忆底座。
安全方面,智能体执行过程中的可控、可知、可恢复已成为关注焦点。今年初OpenClaw爆火时,很多人争相安装,但很快发现其行为不可控、不可知、不可恢复,浅尝辄止后便放弃了。对企业场景而言,智能体的可控、可知、可恢复是其广泛采用的最基本前提。所有安全都需要层层可信环境,最基础的可信基必须由操作系统提供。我们正为智能体构筑事前、事中、事后的控制能力,确保可控、可知、可恢复。这一安全执行环境将基于鲲鹏硬件提供的CCA和TrustZone能力,实现从硬件启动的可信,这也是智能体得以在企业应用的根本保障。
面向Agentic AI,操作系统需要变化
面向Agentic AI,操作系统不能仅停留在演进范式上,还需要更激进的变革。这种变化一定程度上是操作系统计算范式的转变。以前的操作系统管理的是硬件资源和并行程序;面向Agentic AI,它的任务将转变为调度智能体完成业务。在计算范式变化的背景下,我们需要对操作系统做更大刀阔斧的探索。
我们提出,智能体可能需要一种新的执行抽象,面向不同要素建立新的抽象接口,打造Agent智慧引擎。底层能力可封装成可枚举、可监控、可回滚、可确认的标准接口,当这些接口实现后,Agentic Scaling就能在新系统上自然落地。操作系统也需要对多Agent的启停编排进行全生命周期管理。以往,操作系统管理的是应用,应用对应进程,进程调用CPU、内存、存储。在Agent时代,智能体成为新的执行单元,它调用不同的模型、记忆和工具,并可调用其他Agent,通过新的接口标准在推理、内存数据库和容器运行时接口等层面落实。这是面向Agent时代,操作系统需要做出的全新尝试。
鲲鹏超节点打造Agentic AI智能底座
最后做个总结:面向鲲鹏,我们通过异构融合、软硬协同,打造Agentic AI负载下的全新智能底座。依托鲲鹏CPU双线程架构、CCA与PCIPC技术,实现高效安全运行;凭借高速互联通道,达成大容量、高吞吐传输;借助统一内存编程框架,打通各类内存、加速卡、存储设备,深度实现异构融合。这些接口在Agentic AI时代,最终将成为Agent基础设施的一部分,我们将提供资源、沙箱、操作系统原生记忆和安全保障。
通过这些重塑,我们相信鲲鹏超节点能真正成为系统智能的底座,让鲲鹏上的Agent在执行效率和能力上迈上新台阶。Agent是CPU和系统软件的重大机遇,当前我们已有一些思考,也欢迎业界伙伴与我们一道,在鲲鹏上、在基础软件上做更进一步探索,共同迎接Agentic AI的产业爆发。谢谢大家!