2024-02-26 17:02:07 互联网
“种子不好,丰收难保”,耕地有限的情况下,选择品质更优、产量更高的种源成为了保障粮食供应的关键手段之一,良种对我国粮食增产的贡献率超过45%。传统杂交育种如同中医的“望闻问切”,以肉眼观察作为主要的筛选依据,想要选出优质的改良品种需要六代的时间,育种周期长、人力和时间成本投入巨大,效果却难以保证,有时甚至会出现伪杂交率100%的情况,严重制约了种业创新和高质量发展。
作为我国育种领军企业,北大荒垦丰种业打造了以商业化育种为核心的研发创新体系,为新种研发提供了详实的数据支撑,通过国内最先进的基因检测设备对绘制详细的种子基因位点地图,实现对丰产、抗病等基因的筛选聚合,减少了田间的无效种植,将育种周期从十余年缩短到6-7年。
数据要素加速赋能,育种创新迎新挑战
为加快育种创新,种业正在向生物育种数智化转型,一方面要推动生物技术和信息技术相融合,另一方面育种数据规模快速增长,带来一系列计算和数据存储新问题。搭建能够满足生物育种计算和存储需求的数据基础设施,已成为提高育种效率、降低成本的关键举措。这对于垦丰种业的数据基础设施提出了新的需求:
多元数据的安全存储
为使生物育种更精准高效,需要通过数字化技术对种质资源进行存储和保护。垦丰种业建有库存容量可达40万份的种质资源库,一期工程共入库各类种质资源9万余份。就作物基因组数据而言,水稻约有5.6万个基因,玉米约有6万个基因,小麦约有12万个基因,不同生长环境下株型、穗型等表型性状数据则更加多样和复杂,且科研工作对数据存储安全性要求较高,需要强大的数据存储底座支撑。
育种全流程的数据融合与协作共享
垦丰种业的商业化育种平台要求数据能够跨平台、跨系统实时互通、协作共享。同时育种数据呈现多模态趋势,包括基因型数据、代谢物动态数据以及生产管理数据等,这对数据的融合管理也提出了挑战。在育种过程中,育种企业需要具备数据融合的管理应用和共享协作能力,才能提高育种创新效率。
海量基因数据的高效处理和分析能力
作物基因组的研究分析过程极其复杂,包括了基因序列比对、基因网络构建等,同时科研工作中存在持续的文件读写,涉及大量作物图片、音视频片段等小文件,对存储系统的计算性能、稳定性、小文件处理等能力提出更高要求,这就需要育种企业具备海量基因数据的处理和分析能力。
极致存储,助力垦丰破解种子密码
在垦丰种业商业化育种平台建设中,浪潮信息助力打造集中式与分布式相结合的数据存储底座,以超大容量、多协议融合、百万IOPS的领先性能,为垦丰种业各科研平台的种质基因数据存储、流转协作与读写计算提供强有力的支撑,新种研发周期从过去的十几年缩短到6-7年,推动智慧育种创新突破,为我国农业高效提供优质新种。
大容量存储资源池满足育种科研存储和安全需求
面向垦丰育种科研海量多元的数据场景,采用1台HF5000G5+3台AS13000G5的高冗余模式存储系统,搭建大容量存储资源池,充分满足垦丰种业的数据存储需求。同时,当某节点故障时会自动切换到备用节点,满足基因研究数据的长时间稳定写入,确保科研数据安全不丢失,为农作物种质资源提供了优质的存储和保护,提升了育种创新能力。
多协议融合存储满足育种企业数据管理和创新需求
针对垦丰种业基因数据、表型数据、环境数据等多模态多尺度数据需求,浪潮信息助力搭建先进数据存储平台,实现一套集群支持块、文件、对象、大数据等协议数据融合互通,为垦丰种业六大实验室的研究工作提供更高效便捷的数据存储服务。同时,垦丰种业可以利用热、温、冷、冰四级数据分层策略,实现对科研数据的全生命周期管理,高效满足多样化需求,实现存储性能、容量和成本的极致平衡,确保高投入产出比。
百万IOPS满足基因测序高通量处理和分析需求
针对垦丰种业海量数据处理性能需求,浪潮信息为垦丰种业提供极致的存储和计算能力,极大地缩短基因测序的时间。浪潮信息帮助垦丰种业分层搭建的存储系统,可以自动根据读写频率实现数据智能迁移,并以聚合小文件优化技术提升读写性能,容量部署达11PB,聚合读带宽160GB/s以上,写带宽100GB/s以上,随机读IOPS达205万,满足垦丰种业更高的高通量表型组图像处理需求,最大化提升育种科研计算效率和育种创新效率。
现代技术的发展改变了传统育种“一把尺子一杆秤,用牙咬,用眼瞪”的模式,实现了经验育种向精准育种质的飞跃。广袤大地上满目金黄,农民实现增产增收,粮食饭碗稳稳当当,背后是数据要素为育种科研强有力的保驾护航。未来,浪潮信息将进一步提供更加高效、便捷的存储解决方案,洞见数据潜能,赋能智慧育种,为农业智慧转型之旅夯实数字基座。