首页 > 技术

从“云优先”到“数优先”,如何用好数据要素?

2023-07-10 10:19:21      第一财经   


  来源:第一财经

  2023年,AIGC彻底引爆了行业内外对于人工智能的热情,而数据作为AI的营养来源,其获取的便利性和质量直接决定了AI的性能。

  以目前火热的AI大模型为例,一方面对大量高质量数据的需求迫切,但另一方面数据采集、整理和清洗的过程复杂且耗时。此外,数据来源的多样性、隐私保护和合规性问题也是当前面临的挑战,但同时也带来了机遇。

  AIGC中对数据的调用是目前数字化发展的典型应用场景之一。在数字经济飞速发展的当下,行业数字化转型以数据为关键要素,在促进生产力发展和改进生产方式的过程中,催生了一系列的新模式、新应用、新场景,为推动经济社会高质量发展提供新动能。

  而在云基础能力进化和提升的基础上,生长在云上的行业智慧化应用推动了转型的纵深发展,也让数据价值得到了更广泛的认可,云计算的创新正在从“云优先”向“数优先”过渡。

  “从工业时代、信息时代到数字时代,数据价值认知空前提高,数据作为第五生产要素,已成为数字经济发展的核心引擎。”新华三集团高级副总裁、紫光云与智能事业群执行总裁陈子云在近日的一场交流活动中对记者表示,业内对数据认知的提升以及国家对数据资产的推动正在对行业的数字化改革产生深远影响,起到了“里程碑”式的作用。

  为什么要重视数据要素?

  数据要素是五大生产要素之一,其他四个分别是劳动力、技术、资本和土地。劳动力、技术、资本和土地的重要性不言而喻,能跟它们归为一类,数据要素的战略地位可见一斑。

  去年以来,数据要素越来越受到国家重视。在国家财政部宣布数据资源可以计入资产,为数据要素确权打基础后,“数据二十条”在去年年底正式发布,其中对数据产权、流通交易、收益分配、安全治理等方面基础制度作出顶层设计。

  这背后是我国数字产业化和产业数字化持续推进,以数据作为“基础要素”的数字经济发展取得显著成就,作为国民经济“稳定器”“加速器”的作用越发明显。

  2022年,我国数字经济规模达50.2万亿元,稳居世界第二位,继续保持10%以上的高增长率,占GDP比重提升至41.5%。有研究表明,数字化程度每提高10%,人均GDP将增长0.5%至0.62%。

  因此,业界形象地将数据称作数字经济时代的“石油”,数据的流动带动技术流、物质流、人才流、资金流,就像石油的燃烧可以产生动力并带来价值。数据要素作为生产要素后,市场空间非常大,相关数据显示,十四五期间我国数据要素市场规模将突破1700亿元。

  “在这样的背景下,百行百业对数据将有一个共同的需求,就是希望数据成为他们的资产,成为他们的生产要素,希望它能够变现,能够体现价值。”陈子云表示,这样一来,面对行业转型对数据的采、存、算、管和用的能力也提出了更高要求。

  在陈子云看来,对数据的要求来自于两个维度,一个是量的维度,另一个是质的维度。

  “量就是数据量,比如大模型的训练一定是海量数据,没有数据的地方也就没有AI,所以对数据体量的要求会提高很多。质是对数据质量的要求会更高。因为我们通常说,垃圾进去垃圾出来,数据是错的,结论肯定是错的。”陈子云表示,产品一定要能反映这两个维度,一个是海量数据的分析、处理、运营、运维,包括治理等,另外一个则是产品一定能够保证客户提高数据的质量,帮他们做更正确的商业的决策或者业务的决策,提高企业的运营效率,提升他们在市场的竞争能力。

新华三集团高级副总裁、紫光云与智能事业群执行总裁 陈子云

  激活数据价值,走进百行百业

  面向数字经济的持续增长,数据将在驱动行业转型与变革的过程中发挥更大的价值。而在新华三的产品理念中,激活数据要素价值潜能,构建数字社会的核心引擎已经成为明确的方向。

  “百行百业有各自的特点,对数据要素的理解也不同,而对我们而言,对百行百业客户业务场景的理解就变成了我们最重要的一个能力,如何赋能他们智慧用数,如何把数据的价值体现出来,这对新华三来说可能是最重要的一环。”陈子云说。

  新华三集团云与智能产品线大数据产品管理部部长李永平补充道,从方案角度讲,数据要素化的落地其实是需要更懂行业、更懂业务。“所以从我们的角度来讲,需要更多的行业专家去深入理解业务,才能帮助客户实现数据要素发展落地。”

  这就是绿洲平台3.0推出的初衷。

  前不久,新华三举办了以“有数·智享未来”为主题的绿洲平台3.0新品发布会。绿洲平台可以说既是一个技术平台,也是一个生态平台,能够实现海量数据采集汇聚、共享打通、全域融合,从而全方位地激活数据价值,使能行业数字化转型。

  在官方介绍中,绿洲平台3.0将基于深耕行业积累的丰富经验,沉淀政务、水利、教育、医疗、企业五大行业数据方案,将以场景为驱动精准赋能业务创新。

  以水利数字孪生数据中台方案为例,该方案通过监测数据实时接入,提高水利综合监管效能,降低了监管成本。同时打破数据壁垒,增强流域水利工程协同调度能力,并通过知识和模型赋能,支撑“四预”场景更精准、更智能。

  而在智慧医院全域数据湖方案中,数据可秒级入湖、分析与共享,提升数据实效性。海量数据的分析与检索也可以提高科研创新力和转化率。同时,全域数据支撑沉淀数据资产,提高了诊疗效率和准确性。通过建立精益指标管理体系,提升医疗数据资源的合理调配效率。

  “新华三经过这么多年的积累,我们从产品、解决方案到服务,为客户落地了至少上千个案例,从医疗到教育再到最近比较突出的智慧水利,还有交通、金融等,基本上百行百业我们都看到了这个机会,就是帮助客户提高利用数据的能力,用这个能力来推动数字化转型”陈子云说。

  陈子云表示,绿洲平台3.0就是让用数更方便、更简捷,实现用数的简单化和用户体验的升级,数据不管从采集、处理、传输或者是存储等,在性能和速度上都有大幅度的提升。此外,数据还可以自由流动,像流水一样自动地进来,自动地流出去。

  “目前我们的工具能够实现的数据入湖的效率是实现150兆每秒的吞吐量,相比一些传统的方式或者开源的方式性能提升了100倍以上。另外,不管是在数据湖还是数据仓库,加入了一些分布式返程的技术,实现了在实时数仓维度秒级的数据分析以及实现了智能化引擎的计算,实现了秒级的数据计算的能力。”

  谈到未来,陈子云认为,新的技术力既是机会也是挑战,保持乐观的态度。“一定要想办法抓住这个机会,理解客户的痛点,理解他们发展的瓶颈,理解他们对未来三年、五年甚至十年的一些规划、一些想法,只要紧贴着客户的场景,用好这些创新的技术,我对未来还是很有信心。”

  AIGC的火爆应用,一方面对大量高质量数据的需求迫切,另一方面也带来了机遇。近期,新华三在2023 NAVIGATE 领航者峰会上重磅发布了私域大模型——“百业灵犀”LinSeer,为垂直行业和专属地域的客户提供安全、订制、独享、生长的智能化服务。同时,新华三也专为AIGC打造了三款重量级产品:正式推出专为大模型训练而生的AI服务器,让大语言模型训练时间缩短70%;全球首发51.2T,800G硅光数据中心交换机,打造AIGC智算网络“利器”;全面升级新华三傲飞算力平台,定义多元异构的算力调度“最优解”,驱动智能创新加速升级。

  随着数字经济的发展,数字化变革将构建新的经济发展格局,并在构筑国家竞争新优势上起到重要作用,从而释放出更加强劲的动能。在这样的时代背景下,作为数字化行业的领军者之一,新华三给出了自己的答案,也给行业打了个样,加快推进数字技术创新应用,构建数字关键核心技术。只有更多的企业主动拥抱数字经济变革,利用好数字化产生力工具,才能让高质量数据要素“活起来”。

相关阅读