根技术探索，引领科技前沿——Agentic AI负载下智能底座重塑

2026-05-27 10:10:12 中华网

【中国，北京，2026年5月22日】以“心怀挚爱，共绽光芒”为主题的鲲鹏昇腾开发者大会2026（KADC2026）在北京中关村国际创新中心成功举办。在鲲鹏开发者峰会上，华为公司Fellow、ICT操作系统副首席科学家胡欣蔚发表了《根技术探索，引领科技前沿——Agentic AI负载下智能底座重塑》的主题演讲。

图片 1.png

华为公司Fellow、ICT操作系统副首席科学家胡欣蔚

以下为胡欣蔚主题演讲全文

各位领导、各位专家：

大家下午好！我是来自华为的胡欣蔚，很高兴今天下午在这里有机会给大家分享一下我们关于Agentic AI的根技术的一些思考。

过去半年多，AI领域特别是Agent领域发生了巨大变化。这个变化对于做操作系统、做CPU软件栈的我们来说，到底意味着什么？

开环的控制是不稳定的，Agent让AI形成闭环

我们把AI落地分为四个阶段，它们并非替代关系，而是在技术实现难度上有明显差异。第一阶段是感知AI（Perception AI），通过大模型实现从规则驱动到数据驱动的理解，大多数工作负载运行在AI加速器上。第二阶段是生成式AI（Generative AI），基于模型生成内容，各类聊天机器人、Copilot辅助生成代码，这至今仍是AI产业商业落地的主力场景。

我们之前就意识到，如果AI没有Agent或相应辅助手段形成闭环控制，那开环运行必然是不稳定的。因此我们判断，后续一定会出现把AI与数字世界连接起来的场景。过去半年多，这一趋势已愈发明显，也就是现在备受关注的Agentic AI（第三阶段）。

Agentic AI与以往最大的区别在于：AI不再单纯做生成，而是经过思考后产生行动轨迹，交由CPU执行，并基于执行反馈进行下一步规划。这个过程中，CPU如何参与AI，为我们带来了新的机遇与挑战。

CPU从边缘走向中央，成为AI集群规划的独立约束

在Agentic AI场景下，我们至少看到两个明显的技术演进机会。一是单智能体形态：在个人PC或计算设备上启动Agent，需要智算与通算协同，由GPU/NPU负责“思考”，CPU负责“行动”，二者协同打破时延墙。另外，随着Agentic AI在企业场景逐步落地，我们认为多智能体协同也将成为重要演进方向，这涉及CPU调度和内存等核心问题，必须由CPU和操作系统来解决。这就需要通用计算、智能计算、网络、存储（通智网存）深度协同，构筑一体化基石，开创Agentic AI的新范式。

当前，CPU事实上已经成为AI集群容量规划中的一个独立约束。根据TrendForce近期调研，在传统大模型业务中，CPU与GPU的算力规划比例已出现显著调整。业界还有更激进的观点，认为CPU在整个AIGC中的占比需要达到1:1甚至更高。之所以如此，是因为Agent执行复杂任务时，会出现大量异步分支和常驻流，这些天然适合CPU处理；而且任务越多，对CPU算力的要求也越高。因此，CPU成为AI集群容量规划的独立约束，在行业内已经形成共识。

内存与存储成为Agent记忆层，异构融合是理想底座

我们把Agentic AI的演进做一个对比。去年初，Agent的讨论还集中在Prompt Engineering——如何更好地编写给模型输入，让模型尽量一次做对，这时负载主要在NPU上。随后演进到Context Engineering，从单轮走向多轮，CPU承担了更多辅助工作：内容经过拼接后交给NPU推理，结果需要解析并更新到内存中。今年初，业界提出Harness Engineering概念。我们可以把这个阶段看做NPU和CPU的角色发生了置换：此前是CPU为NPU服务、准备数据，现在NPU变成了CPU的Worker，由CPU来调度NPU做什么，吞吐、时延、同步等问题就成了瓶颈。

每一步演进都带来性能影响因素的改变。控制流复杂度大幅提升，从基本静态变为完全动态，CPU需要处理的任务极多，包括图调度、分支依赖、回调、调试等，更多瓶颈从NPU逐步转移到CPU。同时，Tool Call和更多外部系统进入了Agent执行的主路径，这不仅对CPU，更对操作系统提出了关键诉求——每一次工具调用都意味着跨进程交互，需要启动新进程执行新任务，操作系统由此进入了Agent业务主路径。特别需要注意的是，Agent是循环执行过程，单条路径耗时不长，但在紧密循环中会被累积效应放大。高并发场景下，CPU动态能耗占比可达整个系统的40%以上。总体来看，随着Agentic AI演进，系统热点分布已发生显著变化，CPU从舞台边缘走到了舞台中央。

从另一个角度看，CPU侧的内存和存储正在成为Agent的记忆层。Agent与以往对话的一大区别，在于每一轮都会添加上下文。长期运行的Agent，其上下文窗口通常会占到模型支持窗口的50%左右，未来超百万级上下文也可能成为标配。传统上把全部推理过程都放在NPU侧，当前既不现实也不经济。通过协同片上内存与CPU侧内存，把最热、计算直接需要的数据放在NPU的片上内存上，Host侧放置预取缓存，更冷的数据存放于SSD，并由CPU实施统一管理，就能将DDR、SSD与片上内存融为一体，成为Agent真正统一的记忆体。

我们之前提出了异构融合的思路，认为操作系统应该走异构融合的道路，让CPU和NPU从底层就实现协同。基于openEuler超节点的异构融合OS，在池化设备管理、异构融合核心子系统和系统高阶服务等方面都做了相应适配。由于“通智网存”的协同，它自身就是适合Agent运行的底座。当前系统已能够：通过主机自适应隔离与硬件亲和，解决Host Bound性能问题，提升推理吞吐；通过remote fork实现全内核快照和状态回溯跳转，提升沙箱启动性能；通过内存借用、池化、共享等技术，在超节点内实现无序列化直接访问，加速KVCache访问时延。但是我们觉得还有更多的价值空间有待探索，在这里也给大家做个分享。

沙箱、记忆、安全三大能力需操作系统原生集成

当前大家在构建Agentic AI场景时，都会面临沙箱选型问题。业界技术选项很多，有操作系统容器、MicroVM、用户态内核、语言沙箱等。这并非技术路线难以取舍，而是因为Agent使用沙箱的场景本身就多种多样。比如，当运行类似OpenClaw的个人助手时，Agent是长时间运行，过程中需要高度灵活性，给它一个VM独享完整环境是合适的选择。反之，当沙箱用于强化学习中的编码任务，则需要尽量轻量、快速启动、快速重置、短时间内完成的形态。因此，现有各类沙箱技术都有其存在价值。对操作系统而言，我们不做选择题，而应兼容并包，通过提供统一的沙箱SDK，将不同沙箱方案抽象统一，构建系统层面适配多元场景、可灵活定制的竞争力。

但从追求根技术的角度，我们不会停留在沙箱统一上。一方面，所有Agent在运行时，资源重复率非常高。能否基于超节点的技术特点，把不同沙箱间的资源重复降到最低，提升部署密度、降低使用成本？这正是Conch的首要研发方向，依托超节点原生能力实现资源自动去重，显著提高沙箱部署密度。

更重要的是，我们认为Agentic AI发展必将带来一个新趋势——Agentic Scaling。如同DeepSeek等模型在输出结果时进行的内部反复思考与迭代，即Test-time Scaling，我们预期，将来会出现运行在CPU和通用计算算力上的Agentic Scaling。当模型解决问题时，不再仅靠“脑中”反复推演，而是通过不断试错来实现。系统如何为模型提供一个安全、可控的试错基础设施？这就是Conch的核心价值所在：它能在AI尝试不同求解路径时，快速做快照、快速回滚，并将状态影响限制在一定范围内，避免错误扩散到全局。这一技术是我们面向未来Agentic Scaling的重要基础。

在记忆系统方面，我们提出将其做成操作系统原生的能力。当前，操作系统的数据存储系统已与记忆和语义感知强相关——越来越多数据直接以文本形式存放在文件系统，通过高保真读取来重构记忆。操作系统与文件系统在这里有极好的协同空间。通过操作系统原生记忆，可以解决上下文过载带来的Token开销、长任务中关键信息丢失导致的意图漂移，以及NPU与CPU间管理粗放造成的资源浪费。记忆能力虽然单独构建也能取得效果，但正如Windows将图形界面从外挂纳入系统内核带来质的飞跃，我们认为将其沉淀为操作系统原生能力后，也将迎来跃升，这是我们希望为行业提供的更好记忆底座。

安全方面，智能体执行过程中的可控、可知、可恢复已成为关注焦点。今年初OpenClaw爆火时，很多人争相安装，但很快发现其行为不可控、不可知、不可恢复，浅尝辄止后便放弃了。对企业场景而言，智能体的可控、可知、可恢复是其广泛采用的最基本前提。所有安全都需要层层可信环境，最基础的可信基必须由操作系统提供。我们正为智能体构筑事前、事中、事后的控制能力，确保可控、可知、可恢复。这一安全执行环境将基于鲲鹏硬件提供的CCA和TrustZone能力，实现从硬件启动的可信，这也是智能体得以在企业应用的根本保障。

面向Agentic AI，操作系统需要变化

面向Agentic AI，操作系统不能仅停留在演进范式上，还需要更激进的变革。这种变化一定程度上是操作系统计算范式的转变。以前的操作系统管理的是硬件资源和并行程序；面向Agentic AI，它的任务将转变为调度智能体完成业务。在计算范式变化的背景下，我们需要对操作系统做更大刀阔斧的探索。

我们提出，智能体可能需要一种新的执行抽象，面向不同要素建立新的抽象接口，打造Agent智慧引擎。底层能力可封装成可枚举、可监控、可回滚、可确认的标准接口，当这些接口实现后，Agentic Scaling就能在新系统上自然落地。操作系统也需要对多Agent的启停编排进行全生命周期管理。以往，操作系统管理的是应用，应用对应进程，进程调用CPU、内存、存储。在Agent时代，智能体成为新的执行单元，它调用不同的模型、记忆和工具，并可调用其他Agent，通过新的接口标准在推理、内存数据库和容器运行时接口等层面落实。这是面向Agent时代，操作系统需要做出的全新尝试。

鲲鹏超节点打造Agentic AI智能底座

最后做个总结：面向鲲鹏，我们通过异构融合、软硬协同，打造Agentic AI负载下的全新智能底座。依托鲲鹏CPU双线程架构、CCA与PCIPC技术，实现高效安全运行；凭借高速互联通道，达成大容量、高吞吐传输；借助统一内存编程框架，打通各类内存、加速卡、存储设备，深度实现异构融合。这些接口在Agentic AI时代，最终将成为Agent基础设施的一部分，我们将提供资源、沙箱、操作系统原生记忆和安全保障。

通过这些重塑，我们相信鲲鹏超节点能真正成为系统智能的底座，让鲲鹏上的Agent在执行效率和能力上迈上新台阶。Agent是CPU和系统软件的重大机遇，当前我们已有一些思考，也欢迎业界伙伴与我们一道，在鲲鹏上、在基础软件上做更进一步探索，共同迎接Agentic AI的产业爆发。谢谢大家！

分享到微博分享到微信

根技术探索，引领科技前沿——Agentic AI负载下智能底座重塑

相关阅读

新动态

关注度

最话题