2025-09-01 15:47:25 中华网
2025百度云智大会期间,百度云手机重磅升级,推出全自研的Operator技术——通过自然语言指令,实现AI智能体在移动设备端自主完成操作任务。在现场,来自百度智能云的资深技术架构师牟彦滔,为广大AI开发者讲述了Operator的技术架构,并指导开发者们用自己的手机亲身体验了一把”1句指令 = 10步操作"带来的效率进化。
百度云手机:移动设备的智慧效能助手
百度云手机推出的Operator,是一款专为移动设备打造的智慧效能助手,本质上也是一款为众多AI智能体提供的与现实世界交互的工具平台。
Operator一端联接AI大模型能力,为AI智能体安装上各类应用和工具,将AI力量传送到真实用户身边;一端赋能现实世界中的智能硬件,让手机、摄像头、智能家具、电动汽车等终端设备拥有AI的智慧,从而驱动轻量级AI模型在边端生态中释放更大的生产力。
Operator有诸多应用,是数字与真实世界的连接器。
日常生活中,Operator能点外卖、订机票、自动领取游戏奖励;
办公学习中,Operator能出内容、当陪练、智能回复私信固粉;
开发者生态中,Operator能实时处理大规模数据流、并完成不同设备、机型等复杂条件下的产品测试;
边缘侧环境中,Operator能汇集分散信号并智慧决策,如调整信号灯、优化货架摆放、预警车间违规等等。
当前,安卓应用生态依然是数字技术最前沿最活跃的领域,而基于安卓虚拟化和ARM云底座之上的百度云手机Operator,如同给这些设备全都配置了「智驾模式」——AI导航,自主运行,这是对AI生产力的极大释放。
Operator的创新之处
云端执行:Operator并非在本地设备运行一个庞大的模型,而是为每个指令任务在云端分配了一个安卓虚拟分身,让这个虚拟分身来完成复杂任务。这个分身可以是一台设备,也可以是一批设备,更加适合于高并发、高算力、高集成的工作环境。
全时在线:7x24小时异步任务处理,云手机不受用户本地算力、网络或设备使用状态的限制,全天候待命,全时段接收和执行指令。即使员工下班关机,Operator仍能继续完成诸如夜间数据备份、跨时区客户响应、业务订单刷新等任务,实现“人歇机不歇”的业务连续性。
流畅交互:Operator通过VLM视觉语言模型可做到精准识别交互界面,并模拟人类的点击、输入、滑动等操作,流畅完成多步骤、跨应用的复杂业务流程。这种基于真实交互的方式,极大地降低了自动化流程的构建门槛和误操作,保证任务执行的精确率。
沙箱隔离:Operator内的每台云端虚拟机都运行在独立的沙箱环境中,彼此隔离,单一任务出错不会影响其他任务或云端主机。同时,企业用户可对Operator的操作权限进行细粒度管控,确保自动化流程在安全、可控的范围内运行。
Operator的技术实现
Operator是基于云原生安卓虚拟化技术与大模型能力,创新构建了一套“环境感知 - 智慧决策 - 自动执行”的全自动闭环系统,为企业与开发者带来全新的智能工具选择。
其底层引擎依托于ARM架构的百度云手机服务,涵盖IaaS资源池化管理、虚拟化技术,以及PaaS层的调度编排、视频推流与外设虚拟化,无需适配即可兼容绝大多数移动应用。
依托MaaS服务,集成大模型的指令理解与决策能力,结合MCP开放生态、丰富的应用知识库与提示词工程,实现模型与业务数据、工具的高效互联,最终打造出能自主制定策略并高效执行的智能体。
硬件赋能:驱动AI智能体在边端侧生态的应用发展
百度云手机提供开箱即用的Operator MCP Server,以及支持Operator运行的云手机资源管理平台。
Operator MCP Server,提供封装完整的Operator能力接口,用户可直接调用,支持Agent创建、任务和环境信息交互、分析规划、任务拆解和执行、云手机工具调用及流程控制的全链路技术解决方案。针对包括设备鉴权、GUI、设备基础操作(如滑动、点击等)、应用管理、I/O处理(如键盘、音频、视频等)等环节,提供开源或定制化的技术服务。
云手机资源和工具链,基于云原生虚拟安卓实例,支持在多个云手机环境实现多任务同步运行,帮助Agent完成对移动App工具的调用和任务执行。弥补了当前MCP生态不甚完备的困境,解放Agent与移动端应用、边缘侧设备的结合和落地,让AI Agent融入更广泛的应用生态,驱动更大的价值空间。
智能流程编排:支持客户调用更多海外工具,并可视化搭建自动工作流,形成“需求响应 → 工具调用 → 业务执行”的完整闭环。未来,我们将更进一步,拓展接入可自定义的各类工作流,通过自然语言交互,即可实时完善、纠正并可视化Agent状态,提升工作效率,保证任务执行效果。
延伸海外:打造跨境运营自动化新引擎
百度云手机持续赋能品牌出海,在北美、东南亚等地区部署海外原生机房,为客户提供覆盖全球的网络环境支持,帮助其在TikTok、Facebook、YouTube、WhatsApp等主流海外社媒平台上实现本地化、稳定便捷的社媒运营与内容分发。Operator在出海场景中也优势明显,如:
账号批量托管:同时管理和运营多个账号,自动触发SOP运营动作,大幅降低人工成本;
规模获客转化:模拟真实行为,进行规模化内容生产、分发、互动管理,引导流量快速私域转化;
直播运营助手:支持多平台直播、运营,无缝带班主播、活跃直播间互动气氛,自动回复常见问题、规避敏感词;
智能选品测品:及时监测货架平台动态数据,主动测试用户反馈,预测爆款趋势,精准指导选品和备货。
百度云手机旨在帮助更多企业构建安全、高效、可扩展的智慧运营矩阵,让Operator成为实际业务中的得力助手。
欢迎共建:探索AI智能体的无限可能
百度云手机已在容器虚拟化技术、ARM架构软硬件应用、移动生态兼容等领域深耕十年,拥有行业领先的自研技术优势和企业服务经验。本次推出Operator,不仅是云手机在AI浪潮中的一次升级,更是与行业共同探索AI智能体的无限可能。
欢迎各行各业的合作伙伴前来交流,与百度云手机一起智赢未来。