2025-08-22 16:55:50 中华网
两年前,中国信息通信研究院正式公布第二批数字人产品评测结果。声网数字人凭借卓越的技术能力、成熟的工程化能力及完备的安全保障体系,顺利通过三项核心评测,成为国内极少数获得该项权威认证的数字人厂商之一。这一成果标志着声网在“数字人”技术与实时互动融合领域已达到行业领先水平,为其在多元场景中的规模化应用奠定坚实基础。
作为面向开发者推出的PaaS平台,声网数字人产品致力于降低虚拟人应用的开发与部署门槛,帮助开发者快速实现其在社交娱乐、在线教育、金融服务、VR/AR硬件、远程会议等场景中的沉浸式体验,助力企业和开发者高效接入元宇宙生态。
随着元宇宙概念的持续升温,用户对虚拟场景的沉浸感和交互体验提出了更高要求。声网数字人主要提供两类场景解决方案:一是3D沉浸式虚拟空间,可广泛应用于虚拟社交、大型虚拟演唱会、产品发布会等场合,支持万人同时在线、虚拟化身移动及实时音视频通话;
二是虚拟人特写互动,适用于电商直播、虚拟社交、数字客服、主题演讲等需求,支持单人或多人异地实时操控,显著提升应用的灵活性与表现力。
在提升沉浸感方面,声网3D空间音频技术发挥了关键作用。该技术能够基于用户Avatar的头部朝向、脸部角度、声源位置和距离实现音效动态调整,高度还原现实听觉环境,从而为用户提供更具真实感的互动体验。
作为全球实时互动领域的开创者和领导者,声网虚拟人产品最核心的优势还主要体现在超低延迟的位置同步、表情和动作参数同步、音视频同步,以及高并发的稳定处理。这源于声网的RTM 2.0产品,可以让实时消息做到全球范围内平均不⾼于 100ms 、最低达 30ms 传输延迟,满⾜企业元宇宙应⽤场景中对于实时性的严苛要求,给用户打造身临其境的沉浸式体验。
除此之外,声网提供跨平台SDK,支持开发者快速调用虚拟人形象定制功能,如捏脸、换装等,并可自主接入AI驱动模块如面部捕捉。其数字人产品还具备强大的3D渲染与原生适配能力,开发者可通过SDK接口实现界面UI定制、手势交互(拖动、缩放、旋转)及人物朝向与位置控制,大幅降低开发复杂度。
在今年世界人工智能大会(WAIC)上,声网发布了新一代对话式AI引擎。该引擎整合了数字人交互功能,并兼容商汤等主流数字人解决方案,可搭载高度拟真、表情动作自然的数字形象,支持用户与虚拟角色进行实时、流畅的对话交互,有效增强临场感与情感连接。系统提供多种数字人形象选择,适用于虚拟客服、教育陪伴、娱乐社交等多样化场景。
当前,对话式AI正逐渐从基础问答向深度理解、情感共鸣和情境感知演进。声网对话式AI引擎通过集成声纹识别、数字人及视觉理解等先进能力,正逐步构建起下一代自然、沉浸式人机交互的重要基础设施。
总而言之,声网通过其技术领先的“数字人”产品与多元场景应用能力,不仅在金融、教育、社交、直播等行业推动数字化转型,更在元宇宙生态构建中扮演着关键推动者的角色。未来,随着相关技术不断成熟与标准持续完善,声网有望在数字人技术与实时互动融合领域持续引领创新方向。