SuperCLUE最新工业大模型榜单：北电数智骄阳·工业大模型综合得分第一

2025-07-25 18:46:57 中华网

　　7月24日，国内权威第三方评测机构SuperCLUE发布中文原生工业大模型测评基准 SC-Industry(SuperCLUE-Industry)最新榜单。据悉，SuperCLUE 是行业权威的通用大模型综合性测评基准，专注于中文大模型测评;SC-Industry立足中文语义环境与工业场景，充分贴合国内制造业的术语体系与应用需求，不仅深入工业行业细节，全面地衡量工业大模型除知识库之外解决行业具体问题的应用能力，还兼具了工业领域的模型的通用性与可拓展性。

　　SC-Industry从基础能力和应用能力两大维度出发，聚焦工业常规问答、工业数据分析、工业文档问答、工业智能体Agent、工业理解计算、工业代码生成六大能力，对大模型进行效果评估。通过构建专用测评集，SC-Industry结合评估流程、评估标准、评分规则，将文本输入送入超级模型，并对每一维度的评估结果与人类一致性进行分析。

　　图注：SuperCLUE 发布工业大模型能力象限

　　北电数智骄阳·工业大模型以83.44 的总分综合排名第一，其在应用能力维度表现优异，尤其擅长数学分析类任务。在工业领域的综合能力与应用任务表现上，北电数智的骄阳·工业大模型、腾讯Hunyuan-T1 与月之暗面的 Kimi K2位居前列，展现出国产模型在工业场景下的强劲竞争力;同时，国际头部模型OpenAI o4-mini-high 与 Google Gemini 2.5 Pro保持稳定优势，但在多项工业专项任务测试中，已被多款国产模型超越。

　　值得一提的是，骄阳·工业大模型在整体总分第一之外，“应用能力”综合测评结果高达90.07分，同样位居榜首。在“工业数据分析” 细分维度上，骄阳·工业大模型获得90.38的最高分，能够对表格类数据进行出色分析并提供深刻洞察。并且在“工业智能体Agent”上，骄阳·工业大模型以89.87分领跑，其在一定的工业环境中展现出强大的自主或半自主执行任务能力，能有效做出决策，并与其他系统进行交互以优化或辅助工业流程，特别是在多轮任务规划与工具调用中表现卓越，这对于复杂工业流程的落地至关重要。

　　目前，骄阳·工业大模型已成功构建“精准的垂类认知、高质量数据治理体系、严格的合规可信管控机制”三大优势：展现了北电数智在垂类大模型领域的阶段性研发成果，也体现了依托北京电控深厚工业基因的差异化竞争能力。

　　从测评夺冠到产业赋能，北电数智骄阳·工业大模型证明了国产工业大模型的硬实力，也为“AI新国企”在科技自立自强中写下生动一笔。在即将到来的2025 WAIC世界人工智能大会上，北电数智将正式发布骄阳·工业大模型，届时将进一步分享“AI+生产、AI+产品、AI+运营、AI+基础设施”等核心场景的创新能力和标杆实践。这场发布，或许能为国产工业大模型的发展路径带来更多启发。

北电数智

分享到微博分享到微信

SuperCLUE最新工业大模型榜单：北电数智骄阳·工业大模型综合得分第一

相关阅读

新动态

关注度

最话题