2024-02-01 13:06:21 西盟科技资讯
近日,猎户星空发布其自主研发的百亿级参数大模型——Orion-14B。这款集高效能与高性价比于一身的AI模型,在专业场景的多项关键性能指标上可以比肩GPT-4,并可实现千元级消费显卡运行。
在详尽的测试评估中,Orion-14B在MMLU、C-Eval、CMMLU、GAOKAO、BBH等多个主流测试集中均荣膺最优(SOTA)成绩。尤其值得关注的是,在OpenCompass针对中文数据集的综合测评中,该模型在700亿参数以下基座模型中位列榜首,展现了强大的本土化适应能力和全面的语言处理技术。
不仅如此,Orion-14B还展现出卓越的多语言处理实力,在日语和韩语开源模型评测中荣获全球第一,被赞誉为“出海之光”。在业界权威的大模型长文本准确度测试“大海捞针”中,Orion-14B更是交出了200K token全绿的成绩单,同时支持最高320K token的超长上下文处理,相当于一次性看完小半本《三体》(45万汉字)这样的复杂文本内容。
猎户星空强调,Orion-14B的所有成就均基于真实训练与严格测试,坚决杜绝了直接使用基准测试题库进行针对性训练的现象。目前,Orion-14B已全面实现开源,用户可立即在线体验其卓越性能。
据了解,能满足专业场景及企业应用需求,主要得益于猎户星空大模型通过深度微调策略构建了一套完整的七大应用方向解决方案,包括通用对话、插件优化、RAG架构微调、长Token处理、知识抽取、问答生成以及日韩文定制化服务。此外,为迎合小企业市场,猎户星空还推出了近乎无损的INT4量化版本,借助AWQ Q4量化技术,不仅将模型大小压缩了70%,推理速度更提升高达30%。
这意味着,即便是采用NVIDIA RTX 3060这样的消费级显卡,也能实现每秒约50个汉字的高速输出。而在私有化部署方案上,猎户星空提供了易于控制服务器与内网数据的安全方案,同时还开放全套开源免费可商用资源和社区技术支持。
最后,猎豹移动董事长兼CEO、猎户星空董事长傅盛对未来趋势做出大胆预测,至2024年,千亿级别大模型的竞争格局将会发生深刻变化,部分模型可能因应用落地难题而逐渐衰退;相反,像Orion-14B这类具有极高性价比优势的百亿大模型,将在百花齐放中绽放异彩。他认为,超越OpenAI等国际巨头的机会,正掌握在那些专注于大模型应用开发和商业化的公司手中,让我们拭目以待。