2023-10-25 12:41:18 互联网
10月24日,第六届世界声博会暨2023全球1024开发者节开幕,各行各业的大咖云集于此,共同探讨通用人工智能的最新进展和广阔应用前景。讯飞输入法举办了主题为“星火闪耀·输入未来”的生成式AI输入法论坛,重磅推出讯飞首个输入法认知大模型,并现场发布讯飞输入法13.0,定义面向下一代的生成式AI输入法。
讯飞输入法总经理程坤在演讲中提到,当时间的指针指向21世纪第三个十年,伴随00后的涌入,整个行业催生了更多新生需求;与此同时,人工智能迎来“智慧涌现”的大模型时代。未来十年,大模型的应用会深入各个领域,生产生活都将发生颠覆性变革。尤其是大模型展现出强大的生成能力,使人机交互更加自然流畅。因此,输入法团队密切跟进AI技术的新进展,探索研究在中文输入领域的应用,不断思考如何赋能输入生态。
随着AI大模型浪潮席卷全球,抢占布局生成式AI,有助于推动行业发展。科大讯飞AI研究院副院长丁克玉在《面向下一代输入法的生成式AI》演讲中表示,基于星火大模型“1+N+X”产业发展生态体系,同时也为更好地发挥大模型在输入法应用中的潜力,讯飞量身定制了下一代输入法认知大模型,涵盖文本生成、多语言语音、多模态生成的生成式AI能力矩阵,做更靠近业务的AI基座。
丁克玉特别提到,当前一代的输入法基于编解码模式预测输出,对用户意图理解能力有限。然而面向下一代的输入法认知大模型能够基于大量场景数据、不同用户画像信息、多类型外部知识库等进行训练,并通过奖励模型的优劣打分和独家算法,深入理解用户需求和偏好,更准确地识别用户意图,从而生成更个性化的内容,满足用户表达诉求。
对于以AI语音见长的讯飞输入法,每年迭代语音识别效果已成惯例。去年在1024开发者节上,讯飞输入法首发的“语音个性化方言免切换”带动了方言语音使用的快速增长。例如,闽南语、苏州话、长沙话、南昌话、客家语、上海话、云南话等方言使用率分别增长1177%、727%、518%、412%、372%、362%、199%,在人机交互方面发挥巨大作用。今年,讯飞构建多语言语音大模型,创新将识别、翻译、语种分类多任务聚合,达到信息共享互通目的,实现语种免切换识别、语音到目标语种自动翻译以及领域识别效果增强。
丁克玉补充道,“基于讯飞星火多模态大模型,输入法认知大模型将多模态对齐到统一语义空间中,实现多模态协同涌现。”目前,讯飞输入法已经逐步开始落地应用多模态生成式AI能力,例如AI皮肤、AI头像、AI造字……为输入法的个性化带来了全新的可能性,也将成为输入法未来新的增长点。
值得一提的式,科大讯飞新发布的讯飞星火认知大模型V3.0,七大能力持续提升,整体超越ChatGPT,重点升级式启发式对话、AI人设功能,能打造更个性化的AI助手。依托星火大模型,讯飞将AI普惠更多用户。
展望下一个十年,新一代的输入法是怎样的?讯飞输入法产品总监赵明路认为,数字化时代的我们,对输入法的要求全面升维,比如输入内容形态更加多元,输入交互方式更加便捷。站在新时代的新起点上,讯飞输入法13.0全新来袭,用生成式AI重塑输入法,阐释了“从输入到生成表达,从工具到助手服务”的新变化。
作为面向下一代生成式AI输入法,讯飞输入法13.0首先革新人机交互界面,对于传统输入推荐区赋以全新的“活力视界”设计,在屏幕与按键之间独创双行显示,创新卡片式推荐,支持自由组合卡片功能,实现 Feed流式交互体验,展示更高效、使用更便捷。
讯飞输入法13.0内置生成式AI能力矩阵,以满足用户复杂的需求。例如,输入法认知大模型赋能的“AI创作助手”,升级覆盖更多实用场景,帮助用户更好地表达自己;“智能回复”实现用户不用打字也能回消息;“整句联想”支持用户说上句,AI生成下一句。事实上,输入这件事早已不是“打出正确的字”这么简单。
赵明路还表示,“随着大模型正在走向通用人工智能(AGI),走向无所不能。输入法代表了对未来的理解,好的服务需要在正确的时机向正确的人提供。”讯飞输入法13.0基于认知智能的情景连接,已然“用户为中心”,在合适的场景和时机推荐最佳输入方案。在一定程度上,生成式AI输入法全面颠覆原有的输入模式,突破输入法的应用范围,扩大了服务边界。
正如科大讯飞董事长刘庆峰所说的,“大模型时代的大幕才刚刚揭开,让我们一起共创、共享、共进化。”