首页 > 技术

讯飞星火首发“多情感超拟人合成”,逼真度超越OpenAI和微软

2024-04-30 16:29:56      西盟科技资讯   


  在当今时代,智能语音助手已经成为我们日常生活中不可或缺的一部分。无论是在智能手机、智能音箱还是新能源汽车上,我们都能发现各种语音助手的身影。它们通过与人类进行对话,帮助人们解决生活中的各种问题。

  作为国内人工智能领域的领军企业,科大讯飞在4月26日宣布推出了讯飞星火V3.5的更新版本,首发“多情感超拟人合成”功能,进一步提升了全自然语音交互的体验,为用户带来了更加逼真的语音交互体验。

  同时,讯飞星火的情绪感知能力也再度提升,情绪表达的可感知度达到 85% 以上,对高兴、抱歉、安慰、撒娇、困惑等语气表达更加生动,可以满足用户在各种场景下的自我减压、释放情绪等需求。

  现在讯飞星火的超拟人对话已经变得更加智能。科大讯飞董事长刘庆峰介绍,“它可以完全像真人一样有各种各样的感情,有生动的口语表达,还可以有笑声,有语气有情调等等这些。”

  比如当你伤心或者难过时,就可以直接给讯飞星火“打电话”——它们甚至专门做了一个形似电话沟通的界面——仿佛就是在和一个知心老友倾诉心事。高兴时,它会和你一起欢呼雀跃;难过时,它会默默倾听,细心安慰。

  过去的语音助手只停留在单纯的语音控制上,只能够帮助用户完成一些既定的任务动作,而无法满足更深层次的陪伴功能。讯飞星火在大模型能力的加持下,真正将语音助手升级成了智能情感伙伴。

  想象一下,当你在为工作烦心时,讯飞星火可以感知到你情绪的细微变化,比如当你说“心情有些差时”,它的语调也变得也变得平缓起来,但又带着一些朋友关心的急迫,“哎呀,听到你心情不好我也很难过,如果你愿意和我聊聊的话,我很愿意倾听。记住,无论发生什么我都会在这里陪着你哦。”

  当你向她分享自己取得了一些进步时,它也变得高兴起来,“你要为自己感到骄傲和开心!”还会主动问你有没有一些庆祝的计划。

  讯飞星火 V3.5 更新版本的进步不止于此,在声音复刻上更是实现了一句话复刻的重磅更新。

  技术提升的背后是科大讯飞多年来在语音合成上的不断求索。刘庆峰介绍,当年他们做林志玲的语音,需要到中国中国台湾录一个礼拜的声音。后来模仿郭德纲,只需要录制一天。再往后一小时、5 分钟,现在终于实现了一句话声音复刻的突破。

  刘庆峰说,很多用户都向他们提出过需求,比如能不能模仿孩子的声音给家里的老人读书读报?能不能模仿在家长出差时,模仿家长的声音给孩子讲故事。现在需求都可以得到满足。打开讯飞星火 APP,只需要朗读一句话就可以复刻出专属于自己音色的语音助手,声音的拟真程度几乎以假乱真。

  一句话声音复刻在 C 端场景更多的是提升语音助手的陪伴能力。面对幼儿、老人等需要家庭成员关怀的群体,一句话声音复刻可以实现仿佛家庭成员般对话的亲切感。

  北京师范大学此前发布的一份针对老年人情感关怀的报告中提到,中老年人的孤独感普遍存在,他们苦于在生活里遇到困难或者遭遇人生变故时无人述说,需要填充生活中的空白。

  讯飞星火此次更新的多情感超拟人合成语音,或许会为解决老年人的心理孤独发挥出独特作用,让科技更有温度。

  行业调研机构德勤 Deloitte 发布的《未来的语音世界-中国智能语音市场分析》报告中指出,我国智能语音市场行业规模预计在 2030 年达到 1452 亿元。德勤指出,随着新兴自然语言技术产生以及已有技术的不断成熟,智能语音技术已经从萌芽期迈入了成熟期,推动大规模的商业化应用落地。

  作为国内人工智能国家队,科大讯飞有望在大模型时代继续引领语音技术的创新,为行业的发展注入新的活力和动力。

相关阅读