2023-03-16 18:56:51 头条新闻网
报告编委
黄勇
爱分析合伙人&首席分析师
文鸿伟
爱分析高级分析师
目录
1.研究范围定义
2. 市场洞察
3. 厂商全景地图
4. 市场分析与厂商评估
5. 入选厂商列表
1.研究范围定义
研究范围
2021年3月,十四五规划中首次提及元宇宙,指出需要加强元宇宙底层核心技术基础能力的前瞻研发,推进深化感知交互的新型终端研制和系统化的虚拟内容建设,探索行业应用。2022年,北京、上海、浙江、广东等31个省市颁布了元宇宙相关的支持性政策,元宇宙热度持续攀升。
元宇宙是数字化发展到高级阶段后,现实世界与虚拟世界的一种深度融合的产物,是虚拟世界真实化、真实世界虚拟化的交汇载体。数字孪生、数字原生与虚实共生是元宇宙的三大发展阶段,目前,我国元宇宙发展正处于数字孪生初期。
随着传统互联网向Web3.0的跃进、数字化水平的提高以及XR、人机交互等硬科技设备的不断涌现,元宇宙的构建变得更加趋于可行。未来,元宇宙将不仅仅应用于游戏领域,还将广泛应用于金融、教育、工业、娱乐、能源等多个行业当中。
图 1:元宇宙市场全景地图
本次报告爱分析将元宇宙全景地图分为四部分:
其一,基础设施层。在元宇宙早期发展阶段,建设和发展基础设施是重点,包括网络、存储、云计算等计算资源、区块链以及隐私计算等去中心化技术。这些底层技术与基础设施不仅能够保证用户的稳定介入以及全域覆盖,还能够支持海量用户并行使用,稳定存储爆发式增长的数据。
其二,元宇宙引擎层。引擎是搭建元宇宙的核心,开发者通过三维图形图像引擎、3D建模软件、数字人开发平台、AIGC等多种工具调动图像、声音等资源,构建虚拟世界。
其三,交互入口层。该层是元宇宙的入口,XR技术是连接虚拟世界与现实世界的桥梁,VR眼镜、手持设备、传感器等终端设备是产生用户交互的关键,而XR PaaS平台则向XR硬件设备企业提供平台化软件与技术服务,降低了设备企业投入与使用的门槛。
其四,应用层。元宇宙搭建完成后,不仅会吸引C端用户进行社交、娱乐、游戏等操作,还会广泛应用于工业、政务、通信等行业与智慧园区、数字城市、数字文旅等领域。
爱分析综合考虑企业关注度、行业落地进展等因素,选取其中2个特定市场进行重点分析,分别是三维图形图像引擎和AIGC。
本报告主要面向组织的产研部门和业务部门,通过对各特定市场的需求定义和代表厂商能力解读,为企业搭建与应用元宇宙提供厂商选型参考。
厂商入选标准:
本次入选报告的厂商需同时符合以下条件:
厂商的产品服务满足各市场定义的厂商能力要求;
近一年厂商需要具备一定数量以上的企业付费客户(参考第4章市场分析部分);
近一年厂商在特定市场的营业收入达到指标要求(参考第4章市场分析部分)。
(注:“近一年”指2022年Q1至2022年Q4)2. 市场洞察
从内容形态的维度,元宇宙将带来更高维的信息密度和数据价值
元宇宙作为下一代互联网的典型代表,很可能将是人类数字化生存的终极形态。从内容形态的维度看,人类社会的信息传递与交互,经历了从文字、图片到视频的发展历程,主要围绕二维信息展开。而元宇宙的诞生和应用,将人类进行信息传递和交互的维度彻底带入三维空间。这种升维,不仅带来的是全沉浸式交互体验的提升,更多的是在单位时间及空间内融合了现实世界和数字原生世界的信息,因此,极大提升了信息密度。
以元宇宙营销场景为例,元宇宙不仅可以捕捉到用户的停留时长等传统基本信息,还能对用户关注的信息提供更细颗粒度更精准的刻画。以汽车行业为例,在元宇宙场景下,企业能够采集到客户试看汽车时的三维动线,以及停留时长最多的座舱大屏、座椅皮质、空调出风口位置设置,甚至观察的先后顺序等这些传统线下门店、传统互联网很难捕捉到的数据,进而反向支撑产品优化与研发、营销转化。
图 2:元宇宙对甲方企业(to C为例)的价值示意
元宇宙将保持稳步发展,产业奇点尚未到来
元宇宙,本质上是数字化发展到高级阶段后,现实世界与虚拟世界的一种深度融合的产物,技术支撑体系非常庞杂,需要5G/6G、人工智能、云计算、区块链、物联网、三维建模与渲染等技术的深度融合,甚至还需要全息显示、脑机接口等技术做支撑。
从木桶效应角度来看,由于各条技术线发展的成熟度存在差异,因此,从供给侧来看,元宇宙作为技术“集大成”的应用形态,其发展势必需要一个相对长期的过程。同时,从需求侧来看,任何一个技术的爆发,离不开需求侧的应用价值切实落地并以此驱动供给侧,形成良性循环已推动产业健康可持续发展。目前来看,元宇宙主要集中在游戏、工业园宇宙、虚拟化活动、数字文旅等有限场景,需求端推动力仍相对较弱。
与此同时,上海、北京、重庆、杭州、无锡市等地政府已纷纷出台元宇宙专项政策,大力支持元宇宙的发展落地。
值得一提的是,目前由ChatGPT引爆的AIGC,虽然从资本、社会关注度角度给元宇宙带来了一定的短期冲击,但AIGC作为元宇宙引擎层的一项重要工具,可极大促进元宇宙高质量内容的生成,长期来看,反而将持续甚至加速推动元宇宙的发展进程。元宇宙产业的整体应用价值还需要通过供给侧的“技术-产品-场景”大循环首先进行突破,然后带动需求,进而量变引起质变,实现元宇宙应用价值的加深拓宽。
数字人作为元宇宙的入口级应用,需要进一步突破场景
数字人既可以连接C端,又可以赋能B端,是元宇宙中的入口级应用。但目前国内数字人行业发展尚处于早期,尤其是高价值、可规模化的应用场景稀缺,是企业用户和数字人厂商都面临的问题。
根据爱分析调研,目前,数字人的应用场景主要集中在直播播报、游戏主播、品牌宣传、政务服务、客户服务等场景,整体场景还相对较窄,智能交互体验还有待进一步提升,还没有完全脱离“数字”工具属性,走向助手、伙伴等“人”的属性,用户粘性还不充足,制约了场景的广泛、深度应用和价值释放。
另一方面,在特定应用场景下,数字人从前端的IP打造、角色创作、智能交互到后端的运营等,目前的成本还非常高昂,还未达到让大多数人、机构规模化应用的水平,需要在数字人的生产侧、运营侧寻求成本的实质性突破,才有望让数字人“飞入寻常百姓家”。
轻量元宇宙可能成为突破口
一方面,结合当前的发展情况以及应用难度来看,我们认为国内元宇宙的发展路径,将整体呈现出由泛娱乐(C:游戏社交娱乐等)向产业应用(B:金融、工业、医疗、教育、文旅、营销等)加速渗透的互联网经典发展路径。
另一方面,由于元宇宙技术体系庞大,落地应用复杂,整体开发和部署属于“重度”级别,但过程相对缓慢。因此,借助手机等现有终端进行随时随地接入的轻量元宇宙,将有望能够通过撬动需求端,聚集充分的流量,基本解决用户来源问题,反向拉动生产端,进而促进整体生态的逐步正向循环。 3. 厂商全景地图
爱分析基于对甲方企业和典型厂商的调研以及桌面研究,遴选出元宇宙市场中在三维图形图像引擎、AIGC、3D建模软件、虚拟化活动、工业元宇宙方面具备成熟解决方案和落地能力的入选厂商。其他市场,爱分析将在后续的元宇宙系列报告中视情况予以覆盖。
4. 市场分析与厂商评估
爱分析对本次元宇宙项目重点研究的特定市场分析如下。 三维图形图像引擎
市场定义:
三维图形图像引擎,指面向组织快速进行3D数字内容生成与渲染的需求,将图形、图像、交互等领域的复杂知识算法化后进行封装,向组织产研部门、业务部门提供建模、交互、可视化等关键能力的平台化软件,便于组织提升数字内容生产效率,降低3D数字内容创作的技术门槛、制作周期和制作成本。
甲方终端用户:
传媒、教育、医疗、互联网、游戏、汽车制造、建筑工程等行业组织的产研、业务部门
甲方核心需求:
随着XR、元宇宙、数字孪生、虚拟仿真、NFT等市场的不断普及,未来社会对3D数字内容在质量和数量层面的需求,都越来越高。三维图形图像引擎是是实现元宇宙场景应用的最底层根技术,被称为“软芯片”,从虚拟/增强现实、数字孪生、工业软件等热门技术及应用来看,均一致指向实时三维图形图像技术,凸显出三维图形图像引擎的重要性。作为专业软件,产品的性能、易用性、兼容性都十分关键。在当前的国际竞争大背景之下,技术的自主可控也异常重要。具体如下:
在产品性能方面,企业需要引擎具有高成熟度、出色的应用能力,能够满足物理世界和数字世界深度融合的需求,赋能元宇宙等更多开放场域的内容生产,实现所见即所得的实时广播级渲染与可视化交互。一方面,三维图形图像引擎是进行数字内容创作的核心工具之一,需要面向各行业,覆盖3D建模、实时渲染、交互设计、可视化等全流程,因此必须经过长时间、大范围的验证和算法优化,形成成熟产品,有效支撑泛行业3D数字内容创作和产业数字化;另一方面,虚实融合是大势所趋,传统单一的图形引擎很难支撑,面向未来的下一代三维图形图像引擎必须具备图形技术+图像技术的综合能力、具备超大规模实时渲染能力,确保所见及所得,并支持可视化交互,提升数字内容制作效率。
在易用性方面,企业需要相对低门槛的引擎,让专业和非专业团队均能方便、随需、快速建模和修改,提升整体创作效率。随着数字孪生、元宇宙等巨量、无限场景的持续、快速到来,三维图形图像的生成将有更多的应用场景,内容及创意也需要随时持续快速调整,传统通过代码编写构建数字内容的方式,由于专业门槛高,仅适合极少数专业开发者,但整体团队规模反而更加庞大,开发-测试-调优周期长,二次修改难,且主要集中在游戏、影视、广告特效、汽车制造、建筑工程等有边界、交付型的项目。数字媒体、数字孪生、元宇宙等开放场域的内容的创作主体不再局限于专业开发者,同时,创意还将不断调整、内容需持续更新,因此企业需要更加灵活、易用、维护成本更低的3D引擎,赋能非专业开发者,使得数字内容大规模、快速生产、快速分享成为可能。
在兼容性方面,企业需要三维图形图像引擎能够与各类2D、3D专业设计工具高效协同,在确保效果的前提下,追求数字内容创作的最高效率。数字内容大多数情况下是多模态的,可能包括图片、音频、视频等多种内容格式;很多内容创作者保持着使用3ds MAX 、CAD等传统经典设计工具的工作习惯且一时难以改变,因此,为确保协同创作效率,企业需要三维图形图像引擎能够与国内外主流设计软件流畅对接。
在技术的自主可控方面,企业需要三维图形图像引擎服务商具备完全自主可控的技术能力,确保不会因为国际形势突变而面临的封停、断供风险。三维图形图像引擎是包括元宇宙在内的下一代互联网的核心技术设施之一,由于其至关重要,加之进入壁垒、开发周期、资金要求都很高,且底层算法引擎技术需长时间积累和验证,长期以来一直被国外企业所垄断,很多国内厂商也是基于国外的引擎底层技术开发自身的上层引擎,随着国际形势的日趋复杂,技术断供风险加剧,若作为技术底座的引擎被制裁、封停、断供,处于上层的商业工具将无法使用或升级,如果不能实现国产化,将对我国数字内容产业的发展和安全形成严重制约,随时面临“卡脖子”风险。
厂商能力要求
厂商需同时具备以下能力,以帮助甲方便捷、高效、安全地进行数字内容生产:
厂商需要有经各行业客户实践验证、具有高成熟度的产品,在渲染、跟踪等方面,具有国际水平。一方面,厂商的引擎产品需要经过大量客户的检验,并基于客户反馈、行业经验、算法积累等进行迭代优化,确保产品具有高可靠性,覆盖数字内容生产全流程;另一方面,为适应以元宇宙为代表的现实世界数字化向虚实融合的混合世界拓展升维的大趋势,厂商的引擎产品需要同时具备图形、图像综合能力。
在易用性方面,厂商需要将核心能力工具化、组件化,便于业务人员、设计人员直接上手,方便快捷地实现开发与交付。厂商需要降低自身引擎产品的应用门槛,将底层引擎能力共享给开发者,为客户提供集成了底层能力的充足、高效的各类组件,甚至提供低代码、无代码编程能力,让客户方能够经过简单培训,即可熟练操作,进而为创意的持续调整提供有力保障,降低客户的数字内容创作全周期成本。
在兼容性方面,厂商的引擎产品需要兼容常见内容格式和主流设计软件,有效保障客户的整体创作效率。数字内容生产是一个相对复杂的过程和作业体系,厂商的引擎产品需要能够识别和融合、处理文本、音视频等物理世界全要素数据,同时还需要兼容主流设计软件设计模型、BIM模型、工业模型等相关文件格式,实现无缝对接,提升整体创作效率。
在自主可控方面,厂商需要实现从底层技术到图像工具、文件格式、应用标准的自主可控。三维图形图像引擎厂商,需要着眼长远,坚持建模、渲染、交互、可视化等核心技术自研,从底层技术、应用工具、文件格式方面实现全链条的自主可控,甚至随着技术、应用能力的持续快速提升,将来主导应用标准的制定。
入选标准说明:
1. 符合三维图形图像引擎市场定义的厂商能力要求;
2. 近一年在三维图形图像引擎平台市场中付费客户数10家以上;
3. 近一年该市场相关营业收入规模在500万元以上。
代表厂商评估:
(注:以下代表厂商评估均按厂商简称首字音序排序)
艾迪普
厂商介绍:
艾迪普科技股份有限公司(以下简称“艾迪普”),主要从事计算机图形图像实时渲染、跟踪、识别、处理核心算法技术的研发,专注为客户提供广电级、专业级、消费级的数字媒体、AR/VR、数字孪生等无边界内容生产平台与工具。
产品服务介绍:
艾迪普专注实时三维图形图像引擎技术研发与应用,面向传媒、教育、医疗、工业等众多行业,为客户提供元宇宙、虚拟/增强现实、虚拟仿真、数字孪生等产业创新应用的数字内容生产及三维信息可视化的平台与工具组件、解决方案。具体来看,艾迪普可为客户提供实时三维图形图像引擎、数字内容生产的全链路工具集、数字图形资产云平台等“全栈式”服务,以“引擎驱动、工具赋能、资产催化”,服务千行百业数字化转型与降本增效。
厂商评估:
综合而言,艾迪普在技术自主可控、引擎能力、易用性、兼容性等四方面具备显著优势,具体如下:
在自主可控方面,艾迪普在计算机图形图像领域有多年技术沉淀与锤炼,打造了具有完全自主知识产权的IDP Engine实时三维图形图像引擎。
一方面,艾迪普自2003年创立即专注图形图像领域,于 2008 年组建团队,专注国产自主“实时三维图形图像引擎”自研,拥有20年技术积淀,历经十余年锤炼打磨和上亿资金研发投入,打造了拥有100%完全自主知识产权的IDP Engine实时三维图形图像引擎,填补了国内在该技术领域空白,核心技术获国际专利,避免了国内数字内容生产底层技术的断供风险。
另一方面,经十多年沉淀及算法积累,艾迪普已形成专属自有格式MSD,可有效防止文件所包含的全链路信息的泄露及安全风险,从源头保障内容安全。
在引擎能力方面,艾迪普三维图形图像引擎具备图形+图像引擎双能力,在图形图像实时渲染、跟踪、识别、处理等方面技术指标,已达到国际一流水平。
首先,艾迪普实时三维图形图像引擎不仅拥有图形图像双能力,有效克服了单一引擎无法实现物理世界同数字世界深度融合的弊端;同时,艾迪普实时三维图形图像引擎还具备行业稀缺的外部数据实时处理能力,能够实现物理世界与虚拟世界之间的映射、重构、交互融合,进行分析、模拟、推演,可对物理世界更好的感知、试错、预测、降低风险、优化与反控,实现“数”与“实”深度融合。
其次,艾迪普通过国家级+省级项目及超万家重点客户采购应用与功能迭代,结合自身多年算法模组与行业Know-How沉淀和能力打磨,产品成熟度高,形成了实时渲染、跟踪、识别、处理等四大子引擎,可实现所见即所得的广播级高品质实时渲染、3D内容的实时可视化交互,克服了传统游戏引擎在游戏、影视动漫、汽车制造等 “有边界项目”内容生产中存在的定制化工程量大、架构灵活性不足等导致的行业扩展应用 “断代性”问题,可有力支撑元宇宙为代表的“无边界”内容创意的持续调整,更适合泛行业3D数字内容创作和产业数字化的快速落地。
最后,艾迪普实时三维图形图像引擎可将图片、视频、3D模型等多模态数字内容进行实时联动与融合处理,是输出超高分辨率各种通用和专用格式的三维图形图像算法系统,提供高沉浸感、高拟真度、大规模实时交互的超级数字场景自主可控的底层能力。
在易用性方面,艾迪普具有出色的引擎封装及商用能力,极大降低数字内容创作门槛,有助于大幅提升创作效率。
艾迪普将引擎核心能力进行封装,提供3D建模、实时渲染、编辑合成、交互设计到可视化的全链路工具集,针对不同行业领域、应用场景,已抽取出2000+算法模组,客户可通过SDK或API快速集成和直接调用艾迪普引擎层核心技术能力。
同时,通过领先的无代码编程能力,艾迪普提供节点编辑功能,让客户“搭积木”式实现逻辑运算、触控操作、动画触发、与外围设备交互等效果,简洁高效地“拼”出专业级水准的数字内容应用。
此外,艾迪普各工具中均内置CG SaaS一站式数字资产服务平台,超万名创客入驻,提供10W+近400类商用版权素材且每日更新,便于客户随用随取,大幅提升创作效率。
图 3:艾迪普数字内容生产线示意
在兼容性方面,艾迪普广泛兼容多种模态内容及主流设计软件源档文件,并有出色的自适应能力。
艾迪普实时三维图形图像引擎支持多种图片、音频、视频,兼容主流2D、3D设计软件源档文件,可保障客户平稳进行国产化替代,并通过产品间的无缝协同,实现最优产出效率。目前其工具集已经打通Adobe PS/PR/AE、Autodesk 3ds Max/ Maya、BIM、NVIDIA Omniverse等各类设计软件平台。
此外,艾迪普实时三维图形图像引擎还支持DirectX11、DirectX12、OpenGL、Vulkan等多种渲染引擎插件,并可自动根据操作系统选择不同引擎达到最大性能。
典型客户:
中央广播电视总台、光明网、中国传媒大学、用友网络、嘉实基金 AIGC
市场定义:
AIGC,指利用自然语言处理技术(NLP)、深度神经网络技术(DNN)等人工智能技术,基于与人类交互所确定的主题,由AI算法模型完全自主、自动生成内容,从而帮助传媒、电商、影视、娱乐等行业进行文本、图像、音视频、代码、策略等多模态内容的单一或跨模态生成,以提升内容生产效率与多样性。
甲方终端用户:
金融、传媒、元宇宙等行业组织的产研与业务部门、政府部门
甲方核心需求:
AIGC最核心的能力,就是内容生成。经过训练的AI算法模型,能够超越人类创意、效率,相对高质量地规模化生成海量数字化内容。一方面,AIGC可降低海量数字内容的生成成本,将人类从简单且重复、基础性工作中解放出来,聚焦更具创造性的方面;一方面,在人类进行内容创作的过程中,AIGC能够快速生成大量相关内容,帮助人类扩充、寻找创作灵感,或者基于所提供的信息,夯实创作基础。
比如,在传媒领域,部分新闻内容的自动抓取与生成、标题或摘要的自动化生成;在营销领域更具智能的客服机器人,能够更温和、人性化的回答客户常见问题甚至跳跃性问题及非常规问题;在元宇宙领域,可基于智能算法和知识图谱,让数字人更加智能的与人类进行交互。
作为人工智能应用的重大突破,AIGC正在改变甚至颠覆数字内容的生产与消费方式,在Web 3的大背景下,有望成为继PGC、UGC之后的主要内容创作来源。但国内的AIGC整体上还处于相对早期的阶段,不同细分领域的技术及应用落地进度不尽相同。如何基于预训练大模型形成面向不同行业的、可落地的产品及解决方案,是当前AIGC领域发展的关键。具体如下:
在大模型能力方面,企业需要经过调优的垂直化行业大模型,以很好地支撑上层垂直化应用。GPT-3、BERT、Florence、DALL·E 2等通用预训练大模型虽然拥有巨量参数,并拥有良好的泛化能力,但在面对不同行业、领域的具体应用场景时,由于缺乏具体行业的行业语料集,并且未面向特定行业的应用场景对模型做进一步调优,因此,其模型对特定行业应用场景的性能指标很可能并不理想。因此,经过行业化调优和行业语料训练的大模型,才能更好的支撑甲方的具体上层应用。
在落地应用方面,企业需要端到端的AI落地应用服务,确保大模型能够在具体业务场景下,可产生符合预期的实际应用价值,提高组织在特定场景中的生产效能。一方面,AI六十余年的发展历程已经证明,从模型到高质量的生产与实践,AI工程化能力非常重要。但大多数企业往往并不具备从需求的原点出发,到模型的设计、数据标注与模型训练、模型部署及迭代优化的AI闭环落地能力,无法确保大模型真正贴合自身应用场景,实现价值落地;另一方面,很多企业同样也不具备基于大模型进行上层应用开发的能力,预训练大模型虽已经过设计和训练,但由于还需要行业化的二次优化与训练,并且需要结合应用场景进行实际业务应用开发,因此仍旧对企业的AI闭环能力提出了一定要求。
除此之外,甲方还有以下期望需求:
在底层能力方面,企业需要生成算法、预训练大模型的迭代更新,以提供更优的底层算法支撑。预训练模型是人工智能科技巨头在GAN、Transformer、Diffusion、CLIP等基础生成算法的基础上,进行融合、扩展、训练而来的,新一代的基础生成算法在模型架构、精准度方面往往表现更优,例如Diffusion替代GAN成为图像生成领域的主流算法。预训练模型的迭代与突破,在参数量、算力要求、模型效果方面可能会取得更优的综合效能,例如Open AI GPT模型1.0-3.5的持续迭代,抑或是LLaMA以更小体量取得了可能比GPT3更好的模型表现。基础生成算法、预训练大模型的迭代,虽然可能会引发算法效果的质变,但因为需要庞大的人才队伍、巨量资金支持以及长时间积累,往往是只有国内外科技巨头能够覆盖。
厂商能力要求
厂商需同时具备以下能力,以帮助各行业组织实现具体场景的应用落地:
厂商具备基于开源预训练模型,结合行业语料及NLP等技术针对性优化出具有优秀可控性的特定领域大模型的能力。一方面,厂商需要能利用行业know how,结合自身在AI领域的技术积累,微调通用预训练大模型。另一方面,能够充分利用自身在特定行业的数据和语料积累,在微调后的大模型基础上,结合行业化、场景化数据进行进一步训练,以提升大模型针对特定行业及应用场景的模型表现,生成符合一定要求和标准的内容,训练出真正适合特定行业及应用场景的专业大模型。
厂商需要具备出色的AI工程化能力及行业服务经验,能够AI落地全链路服务,灵活适配用户需求。厂商需要丰富的行业经验,能够进行场景抽象和数据准备,在此基础上进行算法设计、模型训练、模型评估与调优、模型部署的全链路能力,并且需要在模型部署上线后,根据行业应用场景的实践,不断进行模型优化,确保模型结果可控,从而让AI大模型的“生成能力”不断接近应用要求,产生真正的业务价值。
针对甲方的期望需求,厂商还应具备以下可选能力:
厂商需要有基础生成算法、预训练大模型的迭代和突破能力,能够为中层的大模型行业化、上层的行业应用提供支撑。厂商需要在自身的技术积累的基础上,对现有Transformer、CLIP等基础生成算法、GPT、BERT、Florence、DALL·E 2等各模态预训练大模型进行深入拆解与思考,提出新的改进思路和方向并进行验证、训练,或者更适合某种语言类型的大模型,以便在模型效果上进行持续突破,进而给行业模型、上层应用提供更多更好的选择,帮助改进模型的应用价值与效果。
入选标准说明:
1. 符合AIGC市场定义的厂商能力要求;
2. 近一年在AIGC市场中付费客户数5家以上;
3. 近一年该市场相关营业收入规模在100万元以上。
代表厂商评估:
(注:以下代表厂商评估均按厂商简称首字音序排序)
拓尔思
厂商介绍:
拓尔思信息技术股份有限公司(以下简称“拓尔思”),以人工智能和大数据技术助力政府和企业的数字化转型为愿景,致力于成为语义智能技术领导者,自主研发相关人工智能和大数据技术,核心业务涵盖大数据、人工智能、内容管理、网络安全和数字营销等领域。
产品服务介绍:
拓尔思目前以语义智能为发展主线,以平台和行业应用产品、云和数据服务相结合的产品+服务战略,实现公司核心技术在众多垂直行业的应用落地,赋能中高端企业级客户的数字化和智慧化转型。在元宇宙领域,拓尔思以服务型数字人为突破口,通过NLP等技术,形成各行业场景的专业知识图谱,助力服务型数字人结合知识图谱与大数据进行内容的自动分析、智能创作、虚拟播报,赋能客户数字人的智能问答、内容播报两大关键场景,为金融、传媒、政府、营销等行业客户的数字人提供“智慧大脑”。
厂商评估:
综合而言,拓尔思在通用大模型调优、行业数据库积累、应用落地能力等三方面具备较为突出的优势,具体如下:
在通用大模型调优方面,拓尔思具有丰富且领先的深度学习、NLP技术积累,具有出色的大模型“垂直化”调优能力,可赋能数字人智能问答与虚拟播报等典型元宇宙应用场景。
拓尔思长期聚焦知识图谱、自然语言处理(NLP)等语义智能核心技术,将通用预训练大模型与传统NLP技术相结合,利用行业Know-How,根据不同场景,通过对通用大模型进行调整和优化(Fine-tuning)来适配不同指标,获得不同行业客户侧重的准确率、召回率、综合F1值等指标,形成行业化的“专业大模型”,进一步优化结果可控性,更好地服务于用户的具体场景和需求。
例如,在元宇宙领域,拓尔思坚持为交互入口层的数字人提供“智慧大脑”的基本定位,基于语音语义识别、自图谱构建到运营的全链路知识图谱能力及丰富行业经验,让数字人具备知识储备、语义理解、推理分析、自主决策和交互表达的智能驱动能力,赋能智能问答、内容播报两大方向,在各具体领域扮演具有专业知识的多种角色,服务各行各业——在金融领域可担任智能客服,也可完成合同智能审批等任务;在政务领域,可进行智能政务问答、知识产权智能审核等;在传媒领域,可进行自动写作或智能写稿并进行内容播报等;在营销领域,可进行直播带货等。
在行业数据库方面,拓尔思具有媒体、金融、政务等多行业服务经验及丰富行业语料,可针对各行业训练出具有行业知识壁垒的高质量大模型。
一方面,拓尔思专注于优势行业专业大模型的研发,在调优后的专业大模型基础上,依托近30年服务媒体、金融、政府等行业一万余家用户所形成的丰富领域知识数据,进一步训练出具有行业知识壁垒的行业大模型,大幅提升通用预训练大模型对行业应用的适配性。
另一方面,拓尔思积累了丰富的各场景行业术语及2000余台服务器数据形成的各行业知识图谱,形成了明显的训练语料等数据优势,在应用场景下可优先起跑,通过反馈+强化学习,加速飞轮效应,持续提升专业大模型的“可控性”与“安全性”。
在应用落地方面,拓尔思具备自模型设计、训练、优化、部署等在内的一站式AI工程化能力,提供端到端的AI应用落地服务。
一方面,拓尔思具备智能数据标注、模型设计、训练、优化、评估、部署等一站式AI工程化落地服务能力,有助于专业大模型贴合用户场景进行快速落地,产生业务价值。
另一方面,拓尔思秉承“开源+自研模型”的基本思路打造“智创”AIGC平台,通过API接口或解决方案模式,更好支撑上层应用,将优先关注元宇宙、传媒、金融领域、政务服务、通用行业和云服务等细分市场。其中,在AIGC “文本生成”领域,拓尔思实现自大模型到上层应用的一体化打通;在视觉、多模态领域,拓尔思将依托开源平台进行研发,偏重前端应用。拓尔思在AIGC领域已相继打造出一批实践案例。
例如,在文本生成领域,为经济日报、浙江日报、重庆日报等近20家新闻媒体单位提供机器写稿服务,为冶金工业信息标准研究院、南方电网、新华网、教育出版社等提供研报自动生成服务;此外,拓尔思还将与某权威新闻机构合作,将该机构的新闻数据库和历史资料录入大模型做预训练,基于高针对性交互,形成权威且高效的内容输出,形成供该机构内部使用的知识型搜索引擎,供该单位的内容创作者进行再创作时做参考,完成辅助创作。
图 4:拓尔思智创AIGC平台架构示意
5. 入选厂商列表