2026-06-14 20:40:50 西盟科技资讯
5月22日,网易有道宣布,决定将“子曰”大模型4.0的核心双引擎——“多模态模型”与“语音合成(TTS)模型”,正式面向全球全量开源。开发者可以免费下载、部署,并基于此进行二次开发。

其中一个较为引人瞩目的点在于它的【语音克隆】功能。
简单概括这个功能:录一段你说话的声音,AI就能用你的音色,带着你的情绪,说14种语言的任何语句,而且听不出是外国人说的。
对此,一位有着过万关注者的技术大V做出了如下评价:网易有道这不声不响就把子曰4给开源了,27B的参数量,数理能力直接冲到SOTA。
不过说实话,我最在意的倒不是这个——而是它的语音克隆能力。

Labs老早就能做。但有个老毛病一直没人真正解决:跨语种的时候会自带口音。你拿中文声音去讲日语,听着就是个外国人在那儿硬凹,真是尬到脚趾抠地。
子曰4这次就是奔着这个痛点来的——你的声音讲日语,听着就像地道的日本人在说话。3秒就能克隆,覆盖14种语言,做口播配音数字人,省钱又好用。
更关键的是,这回是真开源——人家给的是真权重而不是只给API,整整54个G直接让你下,还能本地跑。连有道那个龙虾智能体也一并开源了。
第一,不妨亲自去试试这个语音克隆:传一段你自己的声音,让它说外语,亲耳听听到底带不带口音。
第二,觉得这波开源确实够意思,就去给它点个star支持一下。