首页 > 技术

快手自研大模型「快意」亮相 在多个大模型榜单上表现优异

2023-08-21 16:51:33      CSDN   


  据报道,快手正式加入大模型赛道,其自研大模型「快意」(KwaiYii)已经开启内测,并为业务团队提供了标准API和定制化项目合作方案。目前,「快意」在多个知名大模型排行榜上表现强劲,在CMMLU中文向排名第一,引发了广泛关注。

KwaiYii-13B在CMMLU中文向排名第一

  根据其GitHub主页介绍,「快意」是由快手AI团队从零到一独立自研的大规模语言模型,而本次引发关注的正是其新版本KwaiYii-13B。该模型在多个Benchmark上都处于领先水平,证明了其在自然语言处理任务中的出色性能。

  其中,KwaiYi-13B-Base预训练模型具备优异的通用技术底座能力,在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平,显示了快意大模型在中文和英文上都具备非常强悍的能力。

KwaiYii-13B-Base在Benchmark上的效果(来源:快意GitHub主页)

  而KwaiYii-13B-Chat对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明KwaiYi-13B-Chat超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近ChatGPT(3.5)同等水平。

KwaiYii-13B-Chat在人工评测上的效果(来源:快意GitHub主页)

  据悉,目前「快意」已经开启内测,并为业务团队提供了标准API和定制化项目合作方案,以便在各种业务场景中进行测试和验证。

正在内测的「快意」对话平台

  一直以来,快手AI团队都在专业领域有着出色的表现,研究成果频繁出现在国际顶级会议和期刊上,也多次在全球性比赛中获奖。2022年至今,快手AI团队已发表130多篇顶会论文,覆盖机器学习、自然语言处理、图像识别、语音识别、搜推广等多项研究领域,包含 ICCV/CVPR (21), ACM MM (9) , KDD (9), SIGIR (9) 等顶级会议。

  此前,已有消息表明快手在大模型落地方面进展迅速。7 月 8 日,快手宣布正在内测智能问答产品,在搜索场景中为用户带来智能问答和文本创作等新功能。8 月 8 日,「快手 AI 对话」开启测试,以搜索场景为入口,为用户提供更多元、便捷的搜索形态,大为降低用户的搜索使用门槛,让新技术带来的便利惠及更广泛的人群。据悉,这两个新产品功能均基于「快意」大模型研发。

  8 月 18 日,「快手 AI 对话」 功能已经在快手 APP 安卓版本开放内测,这也是短视频直播行业首个基于大语言模型落地的智能问答产品,在搜索场景中为用户带来智能问答和文本创作等新功能。参与测试的用户点击快手搜索首页右上角AI图标即可进入产品首页,选择输入内容对话或点击引导问题便可开启对话,或者触发「搜索智能问答」卡片,通过底部入口可以启用该功能。

快手App已内测AI对话功能

  据称,快手AI团队将持续迭代「快意」大模型,一方面将继续优化模型性能并研发多模态能力 ,另一方面也在推进更多C端与B端业务场景下的落地 。可以预见,随着如「快意」等大模型的不断发展,AI的应用边界将得到进一步的拓宽,将能为用户带来更丰富的产品体验和更高效的服务。

  据报道,快手正式加入大模型赛道,其自研大模型「快意」(KwaiYii)已经开启内测,并为业务团队提供了标准API和定制化项目合作方案。目前,「快意」在多个知名大模型排行榜上表现强劲,在CMMLU中文向排名第一,引发了广泛关注。

KwaiYii-13B在CMMLU中文向排名第一

  根据其GitHub主页介绍,「快意」是由快手AI团队从零到一独立自研的大规模语言模型,而本次引发关注的正是其新版本KwaiYii-13B。该模型在多个Benchmark上都处于领先水平,证明了其在自然语言处理任务中的出色性能。

  其中,KwaiYi-13B-Base预训练模型具备优异的通用技术底座能力,在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平,显示了快意大模型在中文和英文上都具备非常强悍的能力。

KwaiYii-13B-Base在Benchmark上的效果(来源:快意GitHub主页)

  而KwaiYii-13B-Chat对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明KwaiYi-13B-Chat超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近ChatGPT(3.5)同等水平。

KwaiYii-13B-Chat在人工评测上的效果(来源:快意GitHub主页)

  据悉,目前「快意」已经开启内测,并为业务团队提供了标准API和定制化项目合作方案,以便在各种业务场景中进行测试和验证。

正在内测的「快意」对话平台

  一直以来,快手AI团队都在专业领域有着出色的表现,研究成果频繁出现在国际顶级会议和期刊上,也多次在全球性比赛中获奖。2022年至今,快手AI团队已发表130多篇顶会论文,覆盖机器学习、自然语言处理、图像识别、语音识别、搜推广等多项研究领域,包含 ICCV/CVPR (21), ACM MM (9) , KDD (9), SIGIR (9) 等顶级会议。

  此前,已有消息表明快手在大模型落地方面进展迅速。7 月 8 日,快手宣布正在内测智能问答产品,在搜索场景中为用户带来智能问答和文本创作等新功能。8 月 8 日,「快手 AI 对话」开启测试,以搜索场景为入口,为用户提供更多元、便捷的搜索形态,大为降低用户的搜索使用门槛,让新技术带来的便利惠及更广泛的人群。据悉,这两个新产品功能均基于「快意」大模型研发。

  8 月 18 日,「快手 AI 对话」 功能已经在快手 APP 安卓版本开放内测,这也是短视频直播行业首个基于大语言模型落地的智能问答产品,在搜索场景中为用户带来智能问答和文本创作等新功能。参与测试的用户点击快手搜索首页右上角AI图标即可进入产品首页,选择输入内容对话或点击引导问题便可开启对话,或者触发「搜索智能问答」卡片,通过底部入口可以启用该功能。

快手App已内测AI对话功能

  据称,快手AI团队将持续迭代「快意」大模型,一方面将继续优化模型性能并研发多模态能力 ,另一方面也在推进更多C端与B端业务场景下的落地 。可以预见,随着如「快意」等大模型的不断发展,AI的应用边界将得到进一步的拓宽,将能为用户带来更丰富的产品体验和更高效的服务。

相关阅读