2025-09-23 15:04:48 中华网
9月17日,腾讯全球数字生态大会Agent + Infra专场聚焦“智能体驱动云基础设施跃进升级”这一主题,汇聚众多行业领军者,共同探索AI时代基础设施的技术突破与产业实践。腾讯云智算各产品负责人及行业客户深入解读AI原生云架构、主动服务型基础设施、全链路安全体系等核心议题,同时发布多项重磅成果,为智能体规模化落地筑牢技术底座。
在论坛中,腾讯云副总裁李力正式宣布,腾讯云智算面向“更贴近Agent的AI Infra”重磅升级。腾讯云建立包括Agent Infra解决方案+Cloud Mate云专家服务智能体与全链路安全能力为一体的完整解决方案,帮助 Agentic AI 从“实验室”走向“生产级”。
李力表示,未来两年,部署Agent的企业将翻倍,GenAI相关的IaaS支出增速将达到192%。随着Agent数量爆发式增长,企业对云计算基础设施的需求,将会快速从“资源供给”升级为“业务价值”,AI Infra基础设施必须具备更快的推理效率、更灵活的工具集成、更可靠的系统保障和更自动化的服务能力。腾讯云智算体系核心优势在于 “同源同构”,无需打造 AI 专属存储等设施,依托过往打磨的云原生能力,即可承接智算需求,实现云与智算能力的深度协同。目前,腾讯云智算已实现“一云多芯”软硬协同,支持公有云、专有云、边缘环境的同源同构部署,为交通、制造、具身智能等行业提供从模型训练到推理落地的全链路支撑。
图:腾讯云智算能力升级,成为更贴近Agent的AI原生云
在AI Infra底座层面,腾讯云智算基于在云计算、分布式存储、高性能网络等基础设施方面的深厚积累和场景优化,大幅提升云上资源的性能和利用率,最终实现降本增效。模型启动提速17倍,大规模服务扩容时间从10分钟缩短至34秒;多模态推理加速4倍,自研推理引擎覆盖生文、生图、生视频等模型;通过内存优化与通讯协议升级等创新,显著降低计算开销,推动推理集群的性能发挥到极致。
智能体要从“实验室”走向“生产级”,工程问题和安全问题将成为核心痛点。全新发布Agent infra解决方案Agent Runtime,集成运行引擎、云沙箱、上下文服务、网关、安全可观测五大组件,为智能体提供坚实基础设施,其中云沙箱实现毫秒级启动,数十万实例秒并发。
全新发布的Cloud Mate云专家服务智能体,将专家经验转化为自动化服务,利用Agent的自动化编排能力,在云上架构治理、风险SQL拦截、故障定位等场景大幅提升效率,打造能主动服务的云。目前已为客户提供超百万次智能架构治理服务,在内部实践中,风险SQL拦截率95%,排障效率从30小时降低至最快3分钟。
在安全层面,腾讯云通过一整套大模型与智能体安全治理框架,为云上客户提供安全、可控、可靠、满足监管要求的安全建设思路。方案贯穿模型选型、模型训练、推理部署、业务应用全流程,实现边界API与用户输入/输出安全、模型运行环境安全防护及态势管理、智能体与MCP身份和特权防护、智能体行为与意图安全管控、数据安全全流程安全等。
此外,李力还分享了从数字世界到现实世界的思考。机器人是AI影响现实世界的一个关键形态,但具身智能与大语言模型存在显著数据差异:一方面是具身的数据采集难度比较大,包括视觉、环境、关节角状态等数据均要采集;另一方面,采集的数据与硬件高度绑定,进一步增加了数据采集的门槛。因此,腾讯云希望能够帮助客户跳过数采、训练环节、直接提供支持跨本体直接使用的具身模型非常重要。腾讯云智算联合Tairos(钛螺丝)提供了感知和规划模型服务,通过HAI推理集群获取专属的机器人云上大脑。
Agent + Infra专场上,IDC与腾讯云联合发布了《AI Infra:加速智能体落地的基础架构、发展趋势与产业实践》报告。报告深度剖析生成式AI(Gen AI)规模化落地背景下,AI Infra(AI云基础设施)从基础算力平台向核心智算基础设施的演进路径,系统梳理其技术架构、核心能力与行业适配方案。报告纳入了地平线、货拉拉、一汽丰田、燧原科技、作业帮、考试宝、心言集团、尚航科技、元石科技、智诊科技、德适生物等标杆企业,覆盖交通出行、工业制造、教育培训、泛互联网、具身智能、智慧医疗等六大重点行业,为企业智能化转型提供“技术-场景-价值”三位一体的行动指南。
在专场中,腾讯云多家客户及伙伴参会,作业帮、帕西尼感知科技、智诊科技、燧原科技等各行业代表企业,共同围绕AI时代基础设施的技术突破与产业实践进行深入分享。
作业帮针对教育场景算力供需的矛盾,搭建统一算力网络,通过Docker+K8s容器调度、跨区域云联网、GPU共享(qGPU)、在离线混部等策略,解决算力不足难题,节省算力成本。通过腾讯云COS优化模型分发,全链路耗时从6小时缩至45分钟。同时,借助Agent、MCP协议与向量数据库,将基础服务接入效率提升10倍,构建起教育行业AI与基础设施协同的高效范式。
帕西尼通过带有稀缺触觉模态的亿级全模态具身智能数据,助力AI理解现实物理世界。依托全球首座全模态超级数据采集工厂,年产能近2亿条全模态数据,构建包含触觉模态在内的高质量OmniSharing DB数据集,支撑具身智能大模型OmniVTLA研发。借助腾讯云Data Platform 解决方案实现亿级全模态数据的存储和管理,海量数据通过迁移服务统一采集进入对象存储 COS,GooseFS 提升数据读写性能,加速模型训练效率,让数据自由流转;依托腾讯云算力对全模态数据深加工,可重定向至不同机器人本体;腾讯云TAIROS具身智能开放平台提供完整工具链,将仿真、云服务与前沿具身智能模型快速对接数据和本体,推动全模态数据集 OmniSharing DB赋能具身智能快速落地。
智诊科技,希望基于海量的算力、极致的通信效率和海量数据的高速读取,训练一个能实现“主动式关怀”的医疗大模型,破解医疗成本/医疗效果/医疗可及性这一全球医疗健康的“不可能三角”。其自主研发的千亿参数多模态大模型WiseDiag-Z1,通过腾讯云稳定高效弹性的训推集群、星脉网络(为GPU集群铺设无拥堵超级高速路)、CFS Turbo(为数据供给打造数据仓库),学习超3万亿专业医疗tokens(含19万篇论文、50万真实病例),在MedBench评测中多次登顶中文医疗AI榜首。
燧原科技以国产算力为核心,联合腾讯专有云TCE打造以AI为核心的智算云数据中心,围绕GPU构建高性能网络、存储、云平台、算力与模型MaaS平台及安全平台,全面满足模型训练、推理等智算场景需求。燧原科技首创“互联网推理+城市推理”双算力池模式,成为全国首个获全满分认证的国产超大规模推理集群。其新一代推理加速卡性能较上一代提升2倍+,性价比超旗舰GPU1.5倍+,通过腾讯专有云实现异构算力统一纳管、租户隔离与弹性扩缩容——支持1200+算力节点分钟级扩缩容、业务迁移秒级完成,4天内即可完成万卡规模部署。
Digital Realty以300+数据中心、覆盖6大洲50+城市的布局,构建全球最大智能基础设施网络。其亚太地区数据中心支持单机柜150kW高密度AI负载,通 ServiceFabric实现多云互联与端口级灵活连接,带宽按需调配。依托400G/800G光交换数据平面与智能工作流编排,支撑分布式AI训练/推理,满足低延迟、高吞吐量需求,为企业提供从数据湖到模型调优的全链路支撑,推动AI工作流在全球合规框架下高效落地。
腾讯云通过AI Infra的技术革新,推动云计算从“资源时代”迈向“智能服务时代”。正如腾讯云副总裁沙开波所言:“未来的云计算基础设施将具备自感知、自决策、自优化的能力,而腾讯云愿与伙伴共同加速这一进程。”