2023-09-21 10:02:00 凤凰网区域
近日,由Zilliz 联合亚马逊云科技举办的【向量数据库 X 云计算 驱动大模型落地电商行业】活动在上海圆满落幕,获得业内专业人士的广泛好评。
众所周知,大模型技术的发展正加速对千行万业的改革和重塑,向量数据库作为大模型的海量记忆体、云计算作为大模型的大算力平台,是大模型走向行业的基石。而电商行业因其高度的数字化程度,成为打磨大模型的绝佳“竞技场”。为此,本次活动应运而生。
多位来自向量数据库公司 Zilliz 与亚马逊云科技的专家、电商行业一线的技术大咖在现场贡献了精彩发言,和现场观众共话大模型在电商行业中的应用场景、方案解析、最佳实践等核心话题。其中,Zilliz 资深解决方案架构师沈亮、Zilliz Towhee 开源项目负责人陈将的演讲令人印象深刻。
沈亮从向量数据库的基础知识讲起,由浅入深地过渡到电商行业落地向量数据库的场景。他提到,向量数据库的典型的应用场景包括:在长文本领域,可以进行翻译、问答、语义检索、情感分析;在图片领域可以进行去重、目标检测、图片检索、多模态的图文互搜;在视频领域进行推荐、合规检测、分类等。当然,也有很多新兴的应用场景,比如在自动驾驶领域可以通过向量检索帮助系统找出实时判断过程中没有分析出来的物体。而电商行业盈利基本上靠“搜广推”三板斧,向量数据库技术结合深度学习能做更高质量的“搜广推”,这其中一个重要的技术方向是多模态搜索。沈亮提到,目前大模型在电商领域可以落地的场景包括推荐系统召回、智能客服问答、UGC分析等。
陈将则从技术层面讲述了从零到一搭建电商行业知识库应用的过程。他表示,当前大语言模型存在一定的局限性,例如缺乏领域特定信息、容易产生幻觉、无法获取最新信息、预训练数据无法改变等,知识库可以改善这一情况。这其中,不得不提到由 Zilliz 提出的新范式——CVP Stack。其中,C 是 ChatGPT,即利用大语言模型实现以 ChatGPT 为代表的智能问答;V 是 Vector database,即通过向量数据库为 ChatGPT 提供大规模的、可靠的知识库;P 是 Prompt as code,即使用提示匹配用户问题与来自知识库的参考内容。CVP Stack 的应用场景代表为面向开源用户和开源社区运维人员的问答机器人 OSSChat(https://osschat.io/),而在电商领域,电商用户可以借助问答机器人将商品介绍导入知识库,搭建知识库增强问答。
此外,在现场,来自潮流电商得物的 AI 技术专家孟令公则分享了得物基于 Milvus 的大模型实践。据孟令公介绍,得物目前有上亿级别的向量数据存储在开源向量数据库 Milvus 上,基于 Milvus 的得物大模型训练推理平台可以支持多种类型的业务平稳运行。而未来,随着大模型应用走向规模化和多样化,得物也将进行技术上的更深入探索。