2025-02-28 11:11:53 互联网
近日,由钛动科技特别打造的全球化访谈栏目《Global Talk》迎来了一位重量级嘉宾——生数科技联合创始人兼CEO唐家渝。他带着最新升级的Vidu 2.0版本,与钛动科技创始合伙人Eric展开了一场关于前沿视频生成技术的深度对话,分享了生数科技在人工智能领域的前沿技术和未来展望。
Vidu 2.0:AI视频生成的里程碑
Vidu 2.0版本的推出,标志着AI视频生成进入了一个全新的时代。唐家渝在访谈中提到,Vidu 2.0在生成速度上实现了质的飞跃,4秒钟的视频生成时间缩短至10秒以内,推动视频生成进入“秒级时代”。这一技术突破不仅提升了用户体验,还为未来的实时互动短剧、互动游戏等新型娱乐形式奠定了基础。
除了生成速度的提升,Vidu 2.0还大幅降低了生成成本,生成1秒视频仅需4分钱,视频生成成本真正实现了“分”时代。唐家渝强调,Vidu 2.0在参考生视频的准确性、画面稳定性、精细度等方面也做了全面提升,使得生成的视频更加逼真和稳定。
多主体一致:引领行业标准
Vidu在多主体一致生成能力方面一直处于行业领先地位。唐家渝介绍,Vidu不仅能够实现人脸一致性生成,还能扩展到整个人体、物品以及虚拟CG角色。Vidu 1.5版本已经能够实现“多主体一致”,例如输入人脸、杯子、环境三张照片,Vidu可以自动化生成视频。这一功能对于创作者来说非常重要,因为它解决了传统AI视频生成中主体不一致的问题。
唐家渝还提到,Vidu的底层模型采用了Diffusion+Transformer架构,这是生数科技在全球最早提出的,比Sora的底层架构还要早几个月。这一架构创新使得Vidu在生成速度和准确性上远超其他模型。
全球化布局:从中国走向世界
Vidu自2024年7月全球上线以来,20天用户数突破百万,100天用户数突破千万,目前全球超过200个国家和地区的用户在Vidu平台上生产了上亿条视频。唐家渝表示,Vidu在海外市场应用广泛,特别是在泛娱乐、视频内容创作、广告营销等领域。例如,海外的摄影、相册相关应用底层接入Vidu,亚马逊等电商公司也利用Vidu生成网站商品图。
为了更好地服务全球用户,生数科技在本地化方面也做了大量工作。唐家渝提到,Vidu训练了通用的视频模型,能够学习世界各方面的知识,对于特定国家的文化和偏好,Vidu会特别学习相关文本、视频、图像等知识,以更好地理解和满足当地用户的需求。
未来展望:多模态模型的无限可能
唐家渝在访谈中展望了AI技术的未来发展方向。他表示,生数科技正在研发多模态通用模型,这一模型不仅能够生成视频,还能与物理世界进行交互,例如学习传感器信息、理解世界、操控机械人等。多模态模型的未来非常广阔,能够打通数字世界和物理世界的界限。
在商业化方面,唐家渝强调,生数科技聚焦视频模态,不仅因为技术上的优势,还因为视频在信息表达上的主导性和多样性。视频生成能力的提升能够覆盖更多的应用场景和行业,生数科技将重点深耕两到三个行业,解决核心问题,真正扎根行业。
《Global Talk》栏目通过与唐家渝的对话,不仅展示了生数科技在AI视频技术上的领先地位,还为全球观众提供了宝贵的行业洞察。《Global Talk》栏目负责人表示,此次对话彰显中国原创科技力量的全球站位。作为钛动科技打造的国际化交流平台,该栏目持续聚焦前沿技术出海,通过链接全球产业资源,助力中国企业以技术创新实现高质量全球化。在AI视频技术爆发元年,Vidu 2.0的突破不仅标志着中国在全球AIGC竞赛中占据关键席位,更预示着一个全民视频创作时代的加速到来。唐家渝最后寄语《Global Talk》栏目越办越好,希望钛动科技能帮助更多中国创业者走向世界。