首页 > 技术

数据准确率达99%!清华团队领衔大模型应用,盘活数据资产

2024-11-07 10:40:39      西盟科技资讯   


  AI大模型作为一种新兴的人工智能技术,正在为数据资产管理带来革命性的变革。长期看,数据资产化催生的相关市场潜在规模可能达到10万亿元级。

  启迪之星壹计划企业数安易科技成立于2022年5月,致力于成为优秀的数据服务商,帮助企业客户盘活数据资产,释放数据价值。

AI+数据资产,数据资产管理新机遇

  在数字化时代,数据已成为企业最宝贵的资产之一。数据资产的有效管理不仅关乎企业的运营效率,更影响着企业的竞争力和创新能力。然而,随着数据量的爆炸性增长,如何盘活数据资产,释放要素价值,成为企业面临的一个重大挑战。

  数安易团队创新性的将AI大模型技术应用于数据识别、数据解析、数据清洗、数据标注、数据安全等环节,开发出“数据安全治理平台”,旨在解决这一问题。

  2023年,人工智能技术的崛起,为数据资产管理带来了新机遇。数安易乘势将大模型技术引入产品开发。这一年,团队研发的全线数据安全产品通过渠道伙伴,在金融、运营商等行业客户中实现商业落地。

  数安易创始人黄建江表示,“大模型技术不仅仅能够极大提升数据资产管理的效率,大模型训练需要的高质量数据集,也是数据资产创造价值的一个非常重要的场景。同时,在数据资产创造价值的过程中,必须高度重视数据安全的问题,这是数据资产创造价值的前提。”

开发数据安全治理平台,落地金融、运营商等行业头部客户

  “数据安全治理平台”是数安易的核心技术产品,能够帮助客户将元数据逐步转化为可供大模型训练的高质量数据集,将低价值的元数据转化为具有经济价值、可交易、可管理的数据资产,除了高度智能化外,优势还体现在多模态数据处理能力、以及安全性方面。

  黄建江介绍,“企业的数据以多种类型存在,数安易团队具备的多模态数据处理能力,可以对包括结构化数据、文档数据、视频数据、图片数据、音频数据等多种类型的数据,进行处理、融合、分析,支撑知识体的构建以及应用中文本、可视化等生成。”

  此外,数安易团队开发的高性能PDF、图片和音频数据解析工具,为大模型数据训练提供技术支持,也得到多家大模型公司的一致认可。

  在安全性方面,数安易“数据安全治理平台”内嵌了数据分类分级、数据安全监测、数据安全管控等核心子系统,能够为数据训练、数据可控流动和数据要素市场化流转提供完整的安全防护保障。

  目前,基于数据安全治理平台及多模态数据处理能力,数安易已与数十家大型企业客户达成合作,为客户提供一站式AI数据解决方案。以大语言模型为底座,大小模型协同形成能力中台,提供数据治理、数据安全、数据分析和数据整合能力,提供训推一体化能力,支持智能化运营。

  “从2023年开始,数安易团队已陆续为中国移动、中国电信、中国联通以及几家大型金融机构提供了数据安全治理服务。同时也为多家一线大模型厂商提供了数据处理服务。”黄建江补充道。

助力客户产品故障覆盖率,提升50%

  “与用户共创,确保产品的每一项功能都精准匹配用户的真实需求”是数安易的服务理念。在2个典型案例中,数安易践行了这一原则,深入洞察客户的数据资产实现价值的实际需求,并邀请用户参与到产品的设计与迭代过程中,为客户量身打造了高度贴合其业务场景与操作习惯的解决方案。

  例如,在某运营商ICT运维大脑训练项目中,客户系统存在新增规则协同流程复杂、规则准确率要求高、故障规则存在重叠甚至冲突等故障运维问题,数安易团队运用大模型技术,充分发挥大模型的规则理解能力、数据生成能力、联想推断能力和规则执行能力,通过学习3000+故障告警识别规则和故障间的相似关系,构建故障聚类小模型,对故障类别进行预标注,协助训练故障定位和分类小模型。最终让新模型准确率达到99%,使故障自动覆盖率从54%提升至96%,研发效率大幅提高(运维团队从40人降至10人)。

  在一个大模型技术应用--肿瘤诊断合规性筛查项目案例中,数安易团队运用高质量的人工智能算法体系,以临床需求牵头,全面开展17癌种数据治理工作。为国家医疗监管机构建设成一套完善的肿瘤监测数据库。

  团队层面,公司核心技术团队主要来自清华北大计算机及人工智能专业,长期从事于金融、电信等行业的数据治理、数据安全和IT 运维等领域,具备丰富的大模型技术工程落地经验和产业经验。同时,依托清华大学、北京大学、赛迪研究院等产研单位,能够链接丰富优质的产业和科研资源。

  商业模式上,数安易聚焦于将大模型技术应用到AI+数据资产领域,通过AI平台部署进行推理加速、分布式训练和微调,帮助企业实现私有化大模型部署。以大模型为技术底座,大小模型协同形成能力中台,以标准化产品+定制化服务的方式,提供数据治理、数据安全、数据分析和数据整合等解决方案,助力企业实现人工智能+战略。

相关阅读

    无相关信息