首页 > 技术

平安云原生AI算力资源调度平台,荣获IDC “AI-就绪数字基础设施领军者优秀奖”

2025-11-05 15:25:48      中华网   


  近日,国际数据公司(IDC)公布2025年IDC中国未来企业大奖优秀奖获奖名单,由平安科技打造的《云原生AI算力资源调度平台》创新项目,助力集团斩获2025年度中国未来企业大奖(Future Enterprise Award,简称FEA)“Al-就绪数字基础设施领军者优秀奖”。

  中国未来企业大奖由权威咨询研究机构IDC主办,已连续进行10年,旨在表彰为千行万业数字化转型做出卓越贡献并持续创新的公司,其评选结果在国际市场具有广泛认可度与行业影响力。“Al-就绪数字基础设施领军者优秀奖”旨在表彰为敏捷业务提供平台的数字基础设施,它使用专属云和公有云计算、存储、网络、边缘、管理、自动化和生命周期服务,帮助企业在软件和数据密集时代成长、适应、竞争。

金融级全栈式云原生架构新范式——云原生AI算力资源调度平台

  随着业务规模的扩大,推理业务集群和训练集群资源池逐步变大,由于存在利用低峰期,会遇到资源利用率浪费的问题,比较明显的现象为集群的资源分配率很高但是实际利用率偏低。云原生AI算力资源调度平台使用平安云容器服务,结合GPU异构资源、Serverless技术,与网络、存储等产品,可在保障服务质量的同时,快速调度资源,精确组合推理服务和训练集服务,精辟集合,从而提升整体资源利用率,提高平安云高性能计算产品的能力。

  面向金融行业的AI推理与训练场景,云原生AI算力资源调度平台支持推理任务的持续高可用服务与训练任务的短周期弹性伸缩。平台依托Serverless架构实现智能调度,通过对多种算力资源的统一池化管理和动态调配,支持不同卡型资源在平安内部各BU之间灵活切换,显著提升紧急需求下的资源交付效率2–3倍,并结合显存超分与Pod重调度技术,有效提升资源利用率约30%,实现大幅降本。同时,针对工作时段与非工作时段的资源使用不均衡问题,平台借助训推混部与超分技术,推动试点业务在忙时承载生产推理、闲时一键切换至离线推理或训练任务,从而将固定资源池中的空闲卡利用率提升40%。此外,通过引入并优化GPU虚拟化技术,平台能够适配OCR等小模型对GPU资源的细粒度需求,在保障业务隔离的前提下将单卡切分为多等份,并有效降低80%的切分损耗,在确保服务稳定性的同时进一步减少资源浪费。

  云原生AI算力资源调度平台的理念,从只覆盖应用开发扩展到系统物理部署架构的完整技术链路,每个阶段中都结合金融级的高可用、高性能、业务连续性等特征,并结合业务特征进行成本持续优化,总结和定义成金融级全栈式的云原生架构新范式。

  该项目从500余个申报方案中脱颖而出,标志着平安科技在AI基础设施构建、关键技术突破与产业赋能方面获得了国际权威机构的高度认可,体现了技术创新与商业价值深度融合所带来的标杆意义。未来,平安科技将持续以科技创新为引擎,推动金融行业智能化升级,为构建安全、高效、绿色的数字未来贡献力量。

相关阅读

    无相关信息