首页 > 技术

国内首个!端到端通用语音大模型心辰Lingo在外滩大会正式发布!

2024-09-07 20:01:17      西盟科技资讯   


国内首个端到端通用语音大模型

「心辰Lingo」 8月1日正式问世,

8月24日开放内测预约,

9月5日,在外滩大会正式发布!

  「心辰Lingo」实现了端到端语音技术,在处理对话时直接理解语音,捕捉语气、节奏和情绪,并进行语音回复,减少了信息处理过程中的损失,让“机器”更懂人。这也是国内首个端到端语音大模型,开创了人机交互新方式。

  全球权威咨询机构IDC分析预测,到2030年,全球智能语音服务市场的价值将达到约731.6亿美元,年复合增长率预计将高达27%。全球范围内的科技公司都敏锐地捕捉到了这一领域的潜力,纷纷投身于智能语音技术的开发,一场全新的人机交互革命正在被点燃。

  “心辰Lingo能捕捉到语音中的细微变化,不仅能理解你说了什么,还能理解更想表达什么,真正做到了为AI赋予‘高情商’,使其能够精准洞察言外之意。这也是西湖心辰作为持续深耕大模型情商能力又一个重要技术突破。”西湖心辰CEO醒辰在发布会现场表示。

  西湖心辰针对「心辰Lingo」端到端语音大模型的能力在多个领域和中文上进行增强,使得心辰Lingo的中文语音效果,相较GPT4o更为出色。主要有以下三个技术特征:

  一是,原生的语音理解。作为端到端模型,心辰Lingo不仅能够识别语音中的文字信息,还能精确捕捉其他重要特征,如情感、语气、音调,甚至环境音,更全面地理解语音内容,从而提供更加自然和生动的交互体验。

  二是,多种语音风格表达。心辰Lingo可以根据上下文和用户指令,自适应调整语音的速度、高低、噪声强度,并能够生成对话、歌唱、相声等多种风格的语音响应,有效提升了模型在不同应用场景下的灵活性和适应性。

  三是,语音模态超级压缩。心辰Lingo采用具有数百倍压缩率的语音编解码器,能够将语音压缩至极短的长度,在显著降低计算和存储成本的同时帮助模型生成高质量语音内容。

  日前,心辰Lingo开放内测预约不到10天,已经有超千家企业用户预约测试,包括了教育、金融、医疗健康、政府与公共服务、媒体与娱乐、零售与商业服务、制造与工程等八大行业,数十个实际使用场景。

  市场层面对心辰Lingo的应用空间作出了积极反馈,其中不乏知名企业与院校递交相关使用需求。例如某头部外卖服务商,期待通过AI技术优化其外卖服务,实现智能路线规划和订单分配,提高配送效率和用户满意度,同时在内部使用AI进行语音交互类业务。

  在心理健康咨询场景下,某医院拟运用心辰Lingo的语音技术提供患者心理咨询和干预,通过AI智能对话系统,为患者提供情绪支持,帮助他们应对疾病带来的心理压力;在客户服务与支持场景下,某知名产险企业,希望利用心辰Lingo的语音技术进行客户服务和外呼,针对退保挽留和续保挽留等自动外呼场景,通过智能语音系统提高服务效率和客户满意度。

  此外,陪伴领域还涌现出一系列个性化需求,如游戏语音陪伴、社交辅助助手、语音母婴看护等,这些需求的多样性和创新性为「心辰Lingo」提供了广阔的应用前景。

  这与西湖心辰对「心辰Lingo」的发展规划不谋而合,针对情感陪伴、智能营销等领域进行更深入的垂直模型研发,以加强「心辰Lingo」在这些专业领域的技术实力,为更多企业提供强大的技术支持和赋能。

  10月西湖心辰即将发布基于「心辰Lingo」进行领域深度训练的儿童陪伴、心理疏导、 销售服务3大垂类语音模型,与更多行业领袖携手,共同推动AI技术的创新和应用,开启智能服务的新篇章。

相关阅读