2024-04-30 13:56:49 西盟科技资讯
大型模型不仅要具备实用性,还应注重用户体验,易于操作。究竟什么样的大型模型能够激发用户的兴趣,真正实现广泛的应用和互动?
截至今年3月,根据国家互联网信息办公室发布的《生成式人工智能服务已备案信息》,我国已有117个大模型完成了备案工作。
面对众多的大模型产品,究竟哪一款能够提供更佳的用户体验、操作便利性,并赢得用户的青睐?
市场上存在众多关于大模型的评估榜单,但这些榜单所采用的评价标准和测试维度各不相同,且设置了许多限制条件,这使得我们难以客观地判断大模型的易用性。
应用的下载量是一个直观的指标,能够直接反映出用户对应用的喜好。根据七麦数据的最新统计,截至4月26日,讯飞星火APP在安卓平台的下载次数已经超过了9600万次,在国内工具类通用大模型应用中位居榜首;同时,在苹果App Store中,星火APP的用户评论和评分也处于国内同行业领先地位。星火APP的用户基数在行业内稳居第一梯队,深受广大用户的喜爱和支持。
为什么讯飞星火可以在一众大模型应用中脱颖而出?科大讯飞做对了什么?
模型底座能力是基础。讯飞星火今年更新的 V3.5 版本是首个基于全国产化算力平台“飞星一号”训练的全民开放大模型,整体能力接近 GPT-4 Turbo,语言理解、数学能力均已经超过 GPT-4 Turbo,代码能力达到 GPT-4 Turbo 的 96%,多模态理解达到 GPT-4V 的 91%,处在国际领先水平。
但除了模型能力的提升之外,想要收获 C 端用户的欢迎还要具备好用、易用等特点。讯飞星火发布之初,针对用户不知道如何使用大模型这一痛点,就上线了星火助手功能,可以一键生成专属于自己的个性化 AI 助手,甚至还可以直接对外发布,人人可用。
在星火 APP 的助手页面,你可以看到各式各样的 AI 助手,有工作场景的,比如 PPT 大纲助手,SWOT 分析助手,周报助手甚至是小红书文案助手;也有服务于编程的,Python、C++、java 等等编程语言应有尽有;趣味性的助手更多了,高情商助手、电影剧情大事、废话文学乃至冷笑话助手,让你能用也能玩。
时下大热的长文本功能讯飞星火也没错过,甚至比同类产品更进一步。科大讯飞 4 月 26 日发布的讯飞星火 V3.5 更新版本中,除了支持长文本,还支持长语音、长图文,这是业内首个同时支持长文本、长图文及长语音的大模型产品。不仅可以解决文字性的内容的整理,你在工作学习中随手拍的会议纪要、PPT照片乃至课堂录音等都可以发给讯飞星火。讯飞星火还针对性地推出了星火合同助手和科研助手,解决用户在工作生活场景中的刚需痛点。
科大讯飞董事长刘庆峰表示,一段时间以来,讯飞星火的开发者和用户都高度关注知识的获取和学习问题。在这个过程中和不仅要解决长文本的问题,能够把各种信息来源的海量文本快速的学习和问答,特别重要的还是在各种企业和专业行业应用的准确率问题,尤其在金融、在汽车、在政务等等非常关键的领域,大模型的回答要足够准确。
更关键的是,在保证准确的基础上,讯飞的长文本能力同时兼顾了效率问题。基于讯飞星火V3.5对长文本的理解、学习、回答能力,科大讯飞进行了重要的模型剪枝和蒸馏,从而推出业界性能最优的130亿参数的大模型,在效果损失仅3%以内的情况下,使得星火在文档上传解析处理、知识问答的首响时间以及文字生成方面都获得了极大的效率提升。测试显示,在保障长文本效果的情况下,无论是10K、64K、128K token,还是更长的文本上,星火大模型的性能都是业界最优的。
在日常生活中,当人们需要处理租房合同时,往往会感到困惑和不安,因为合同中可能存在许多难以察觉的陷阱。幸运的是,讯飞星火的先进文本处理功能可以帮助人们轻松应对这一挑战。无论是电子版还是纸质版的合同,讯飞星火都能通过拍照上传的方式,快速进行审核,帮助用户发现潜在的风险和漏洞。
此外,讯飞星火的合同助手还提供了合同比对、摘要总结以及合同生成等实用功能,极大地方便了人们的生活和工作。当面临法律纠纷时,用户还可以咨询“星火法律咨询”助手,获取专业的法律意见和解决方案。
例如,当遇到工作中的暴力裁员问题,或者对过年期间劝酒的合法性有疑问时,讯飞星火都能提供及时、准确的法律解答,帮助用户维护自己的合法权益。总之,讯飞星火的合同助手和法律咨询功能,为人们提供了全方位的法律支持和保护。
专业能力过关,讯飞星火同时更有温度。早在今年 1 月,讯飞星火就首发了超拟人合成语音功能,让 AI 不再是冷冰冰的播音腔,同时具备超强的情绪感知能力,能像“知冷知热”的朋友一样带入情感互动,更具人情味。
这一技术的提升背后不仅得益于讯飞星火V3.5在语义理解、指令跟随和多轮对话的演示中展现的优异能力,还有在情绪感知和拟人合成方面的出色表现。
讯飞星火 V3.5 此次的更新版本中,这一功能再度加强,首发多情感超拟人合成功能,进一步提升了合成声音中情绪表达感知能力,情绪可感知度达到 85%以上,可以实现包括高兴、抱歉、安慰、撒娇、困惑等多种情感语气表达。
正如刘庆峰说,“技术在不断的进步,我们希望在安全可控的前提下,能够带来这个社会更有温度的人工智能的体验,能够真的帮助到那些特别需要帮助的人。今天这个世界更需要有温度的科技。”
不仅要具备可用性,更要追求易用性和良好的用户体验,这可能是某些大模型应用能在激烈的同质化市场竞争中突显其独特价值的关键所在。科技不应是缺乏情感的,它需要在AI时代展现出既有能力又有人情味的一面,这样才能真正赢得公众的广泛喜爱和认可。