《Global Talk》对话生数科技：国产视频生成模型Vidu 2.0引领视频生成进入"秒级时代"

2025-02-28 11:11:53 互联网

　　近日，由钛动科技特别打造的全球化访谈栏目《Global Talk》迎来了一位重量级嘉宾——生数科技联合创始人兼CEO唐家渝。他带着最新升级的Vidu 2.0版本，与钛动科技创始合伙人Eric展开了一场关于前沿视频生成技术的深度对话，分享了生数科技在人工智能领域的前沿技术和未来展望。

　　Vidu 2.0：AI视频生成的里程碑

　　Vidu 2.0版本的推出，标志着AI视频生成进入了一个全新的时代。唐家渝在访谈中提到，Vidu 2.0在生成速度上实现了质的飞跃，4秒钟的视频生成时间缩短至10秒以内，推动视频生成进入“秒级时代”。这一技术突破不仅提升了用户体验，还为未来的实时互动短剧、互动游戏等新型娱乐形式奠定了基础。

　　除了生成速度的提升，Vidu 2.0还大幅降低了生成成本，生成1秒视频仅需4分钱，视频生成成本真正实现了“分”时代。唐家渝强调，Vidu 2.0在参考生视频的准确性、画面稳定性、精细度等方面也做了全面提升，使得生成的视频更加逼真和稳定。

　　多主体一致：引领行业标准

　　Vidu在多主体一致生成能力方面一直处于行业领先地位。唐家渝介绍，Vidu不仅能够实现人脸一致性生成，还能扩展到整个人体、物品以及虚拟CG角色。Vidu 1.5版本已经能够实现“多主体一致”，例如输入人脸、杯子、环境三张照片，Vidu可以自动化生成视频。这一功能对于创作者来说非常重要，因为它解决了传统AI视频生成中主体不一致的问题。

　　唐家渝还提到，Vidu的底层模型采用了Diffusion+Transformer架构，这是生数科技在全球最早提出的，比Sora的底层架构还要早几个月。这一架构创新使得Vidu在生成速度和准确性上远超其他模型。

　　全球化布局：从中国走向世界

　　Vidu自2024年7月全球上线以来，20天用户数突破百万，100天用户数突破千万，目前全球超过200个国家和地区的用户在Vidu平台上生产了上亿条视频。唐家渝表示，Vidu在海外市场应用广泛，特别是在泛娱乐、视频内容创作、广告营销等领域。例如，海外的摄影、相册相关应用底层接入Vidu，亚马逊等电商公司也利用Vidu生成网站商品图。

　　为了更好地服务全球用户，生数科技在本地化方面也做了大量工作。唐家渝提到，Vidu训练了通用的视频模型，能够学习世界各方面的知识，对于特定国家的文化和偏好，Vidu会特别学习相关文本、视频、图像等知识，以更好地理解和满足当地用户的需求。

　　未来展望：多模态模型的无限可能

　　唐家渝在访谈中展望了AI技术的未来发展方向。他表示，生数科技正在研发多模态通用模型，这一模型不仅能够生成视频，还能与物理世界进行交互，例如学习传感器信息、理解世界、操控机械人等。多模态模型的未来非常广阔，能够打通数字世界和物理世界的界限。

　　在商业化方面，唐家渝强调，生数科技聚焦视频模态，不仅因为技术上的优势，还因为视频在信息表达上的主导性和多样性。视频生成能力的提升能够覆盖更多的应用场景和行业，生数科技将重点深耕两到三个行业，解决核心问题，真正扎根行业。

　　《Global Talk》栏目通过与唐家渝的对话，不仅展示了生数科技在AI视频技术上的领先地位，还为全球观众提供了宝贵的行业洞察。《Global Talk》栏目负责人表示，此次对话彰显中国原创科技力量的全球站位。作为钛动科技打造的国际化交流平台，该栏目持续聚焦前沿技术出海，通过链接全球产业资源，助力中国企业以技术创新实现高质量全球化。在AI视频技术爆发元年，Vidu 2.0的突破不仅标志着中国在全球AIGC竞赛中占据关键席位，更预示着一个全民视频创作时代的加速到来。唐家渝最后寄语《Global Talk》栏目越办越好，希望钛动科技能帮助更多中国创业者走向世界。

生数科技

分享到微博分享到微信

《Global Talk》对话生数科技：国产视频生成模型Vidu 2.0引领视频生成进入"秒级时代"

相关阅读

新动态

关注度

最话题