首页 > 技术

产教融合新生态下的数据库人才破局之路

2026-05-07 11:14:42      中华网   


数字经济深入发展、基础软件国产化替代加速,数据库人才缺口日益凸显。AI 正以前所未有的速度重塑岗位能力模型,高校课堂与产业现场之间,隔着的不只是“最后一公里”。企业到底需要什么样的人才?高校如何让学生敢碰、愿碰数据库内核?开源社区能否成为弥合断层的关键接口?

4月23日,「YOLANDA 科技见闻」独家联动 HOW 2026(PostgreSQL & IvorySQL技术峰会)推出一期主题为“产教融合——数据库人才培养:企业需求、高校教育与开源生态的三角对话”的圆桌论坛。来自瀚高数据库、华东师范大学、武汉大学、深圳大学的专家围绕数据库人才培养议题展开了一场坦诚对话,共同探讨了数据库人才培养的路径、痛点与未来方向。

【圆桌嘉宾】

汪丹(Yolanda):主持人,墨创数迹创始人、前极客邦科技合伙人、前 InfoQ GM

吕新杰博士:IvorySQL 技术委员会主席、瀚高数据库副总裁、PG Asia committee member/亚洲 PG 大会组委会成员

王伟教授:华东师范大学数据科学与工程学院教授、国家级全民数字素养与技能培训基地负责人、X-lab 开放实验室创始人、CCF 杰出会员、CCF 开源发展委员会委员

彭煜玮博士:武汉大学计算机学院副教授、 《PostgreSQL 数据库内核分析》作者、《由浅入深 PostgreSQL》等书译者

秦建斌教授:深圳大学研究生院副院长、深圳大学卓越工程师学院筹建负责人、深圳大学特聘教授、深圳计算科学研究院研究科学家、CCF 专业会员、信息系统专委会常务委员、 数据库专委会和大数据专家委执行委员

媒体社区代表:CSDN、51CTO 、稀土掘金 、腾讯开发者社区 、华为开发者社区、博客园、墨天轮等社区媒体代表

本文内容根据圆桌论坛实录整理。

企业侧:AI 重构能力模型,开源贡献成“硬通货”

瀚高数据库是一家坚持开源技术路线、深耕 PostgreSQL 生态 20 年的国产数据库厂商,自主研发成立IvorySQL 开源数据库社区。据瀚高数据库副总裁吕新杰博士介绍,公司近三年每年校招/社招规模维持在 70~80 人,岗位覆盖内核研发、工具研发、测试、产品经理、DBA 及售前、迁移、售后技术支持全链条岗位。

企业在持续招人,用人需求也在发生变化,这背后是 AI 带来的直接影响。吕博士以团队中的具体岗位举例:测试人员用 AI 生成用例,效率提升至少一倍;产品经理可以完成从需求调研、产品规格说明书、产品原型到前端界面的“四合一”工作,实现角色内的一步到位,无需反复与前端同事沟通;售前与售后团队则利用 AI 生成解决方案、改写迁移方案及排查故障。不同岗位从各自角度使用AI,生成差异化的skill。

具体到校招选人标准,企业既关注候选人在数据库原理、数据库实践方面的基础能力,也愈发重视学生的可塑性和未来成长空间,比如他们学 AI、用 AI 的能力。事实上,不少应届生入职后一个明显的短板是基础不够扎实,包括对操作系统、C/C++、计算机体系架构和编译原理等底层基础知识的掌握薄弱,企业需投入资源帮助新人补课。如今,AI正在改变这一阶段的培养模式:“以前一个本科生进来,可能要培训半年才能写插件,一两年才能碰内核;现在借助 AI,这个时间缩短了一半。我们的课程里加入了很多 AI 使用的内容,比如借助 AI学习一个模块算法的控制原理等。”

这也体现了企业选人标准的迭代:对专业领域底层基本功的“绝对要求”关注度降低,但对学习能力、韧性、责任心、底层研发兴趣和热情等“综合素质”要求在提高。

在简历中,哪些关键词会成为加分项?吕博士指出:“PostgreSQL 社区贡献”是最具吸引力的信号之一,哪怕只是名字在社区感谢列表里出现过。更进一步,若候选人阅读过PostgreSQL或其他重量级操作系统的源码,能形成个人理解并撰写相关技术博客,将更具优势。再进一步,若对知名开源项目的某个模块有较深入的理解,即使仅在该模块上做出过微小优化,也能体现其深度钻研的能力与潜力。含有上述信息的简历,将获得极高的面试优先级。

吕博士还补充说明:“开源贡献”也是加分项,其“硬通货”价值体现在多方面:开源贡献及相关经历有助于培养开发者良好的职业素养,这种素养需在商业、产品侧落地(性能提升、功能实现)后通过项目或研发激励奖体现;如果人选在开源社区非常活跃(如 Hackers 邮件列表里经常发言),对底层技术有热情,企业会放宽在学历等方面的硬性要求。

高校侧:现实困境与创意突围

与企业对数据库人才的渴求形成对比的,是高校课堂里的现实困境。三位来自不同高校的老师,各自分享了他们的探索。

武汉大学彭煜玮博士:学生的“怕”与老师的“托举”

武汉大学彭煜玮博士直言,数据库内核从来不是学生眼里的“热门选项”,对数据库内核感兴趣的少,“怕”的多。数据库技术栈很深,学习曲线陡峭,因为数据库其实是计算机学科几大核心课程的一个综合性实验。了解一个大型的几百万行源代码的数据库系统还不算最大挑战,学生怕的是数据库的高耦合度,随便动那么一点点地方,很可能整个系统就出问题了,要解决这个问题,就不能仅仅了解所修改的模块,而是要了解整个体系的情况。“学生花这么大精力去搞内核,除了把前序知识串起来,他很难知道自己能不能变现、能不能找到好工作,缺乏信心。”更现实的是,课程通常开在大三下学期,此时学生的研究方向和就业 Offer 基本已定,“让他现在来做内核,学生很难有驱动力”。

高校的一大痛点是课程体系各自为战。前面提到数据库需要很多前置基础(文件操作、网络编程、编译等)在前序课程(操作系统、计算机网络)中不讲或不实践,这就导致数据库课上要花大量时间“补课”。另外,AI 也给课程带来了冲击,如果题目简单,学生用 AI 基本就能得满分。偏性能的题目 AI 目前做得不太好,但多次迭代也能解决。

面对这些挑战,彭博士的三个尝试:第一,做开放实验室,类似于系统软件/数据库俱乐部,让学生在课前课外先接触到相关知识。从这里,让未来关注数据库内核的同学涌现出来。第二,课程里,给学生“二选一”的选项,可以选择常规的方式,做一个 Mini DBMS,也可以选择在 PG上去做一些内核扩展。第三,计划筹办 PG 内核暑期学校,面向在校生和对 PG 感兴趣的社会人士,做一些培训和知识普及。

如果发现了做数据库内核的好苗子,彭博士更会不遗余力地为学生“铺路”。通过“开小灶”形式进行个性化答疑解惑;采取多种方式帮助学生弥补信息差,如介绍行业福利与成功案例、推荐大厂实习或就业机会、分享师兄师姐的成功经验,使其充分了解数据库内核人才的市场需求;在夯实理论知识的基础上,带领学生参与基于PostgreSQL、IvorySQL等开源数据库的实际开发工作,积累真实项目经验。

深圳大学秦建斌教授:一门“硬核”课的求生与进化

深圳大学秦建斌教授分享了他做数据库教育的“血泪史”。秦教授回国后深感数据库“卡脖子”的核心在人才,基于他对学生工程能力弱的观察,他在深圳大学推行基于真实 PostgreSQL 的内核课程。他坚持用 PG,拒绝使用简化版迷你DB,要求学生在真实的数百万行代码中“管中窥豹”——给定一个清晰的目标功能,从内核的一个点切入,逐层理解代码并完成任务。

他所讲授的数据库课程最初同时面向本科生与研究生开放。然而,研究生层面的授课很快难以为继:第一学年结束后,第二学年导师便不再允许学生选修该课程,也不向下一届学生推荐,主要原因是课程难度过高。相比之下,本科生群体却认为这门课“足够硬核”——课程中的PostgreSQL大作业以及阅读一两万行源代码的经历,能够写入简历,显著提高获得面试机会的概率。随着口碑不断发酵,选修人数迅速攀升,去年甚至不得不对部分学生进行“劝退”。

秦教授的这门课在培养什么?他也认同数据库是计算机科班生最全面的实践平台,涵盖操作系统、体系结构、内存管理、编译原理、分布式、并发,以及数据库特有的 SQL、关系模型、优化等。在他看来,课程不仅旨在培养数据库内核开发人员,更是培养学生“数据密集型系统的分析、开发和验证能力”,这种系统思维在 AI 时代非常重要,如 AI 底层技术架构、训练、数据调度等环节,包括“小龙虾”的引擎架构也与数据库高度相似。

由于课程难度较大,以往学生的作业平均分较低,通常为五六十分。然而,去年学生作业的平均分提升至80多分。发生了什么?其实是学生用了 AI 编程工具辅助他们完成作业。面对学生用 AI “助攻”作业的情况,秦教授反而感到欣慰,表示积极欢迎。他认为,“学生会在难题下寻找先进工具解决问题”,这本身就是很重要的能力。当然,这一变化也倒逼他将题目设置得更具挑战性,比如拿开源界的真实项目。

秦教授目前在参与一个卓越工程师培养项目,目标是为产业培养真正具备工程师能力的学生。他正在思考并探索未来校企联合的卓越工程师培养框架,认为有必要进行一定程度的创新。例如,硕士毕业条件是否可多样化,如在 PG 里实现一个Feature 被社区接收,就可以作为硕士毕业条件,而不是单一的发论文形式。

华东师范大学王伟教授:Open Source for Education 标杆实践案例

华东师范大学王伟教授指出,整个计算机课程体系正面临 AI 带来的重构甚至崩塌风险,而国内高校课时碎片化、专业建设重复的问题尤为突出。高校在人才培养方面,符合 AI 时代人才需求的系统化知识建设有挑战,职业规划视角实际的应用场景需要更多的业界导向。

他相信开源社区能拉近学校与产业界的距离,把企业开发者遇到的真问题、业界新技术新发展输入到高校,是最快将业界经验传导到高校的途径。当前,国家已将开源纳入“十五五”重要战略,职业教育领域也已开设开源相关专业。

近年来,华东师范大学深度探索并采用开源模式推进人才培养,践行“Open Source for Education”理念。通过运用开源方法与资源,对课程体系进行快速迭代,鼓励教师带领学生积极参与社区贡献。在这个实践里,把一些开源任务作为学生实践,放到课堂里来。更具颠覆创新的是,建立了一套新的评价体系:没有传统笔试,学生的成绩由其在 GitHub/Gitee 上的行为数据决定,通过代码内容、与同学/助教/教师的合作网络、社区贡献度等一系列指标来衡量学生的开源贡献,最终形成可量化的“开源贡献图谱”。

王教授强调,这一培养模式不仅考察学生的硬核技术能力,更有助于培养其沟通交流、上下文交代、跨国协作等综合素养。这些能力在AI时代对于人才发展具有更为深远的意义。

开源社区:人才“沙箱”,校企连接器

从三位高校专家的分享中,我们可以看出,在高校与企业之间,开源社区正在成为关键连接器。作为亚太地区PostgreSQL 国际社区顶级贡献者之一,瀚高数据库发起成立的 IvorySQL 开源数据库社区,在其中扮演着特殊的“沙箱”角色。

据吕新杰博士介绍,很多在中国信创背景下的客户定制需求,会先在IvorySQL社区落地实现,并经过一至两年的生产环境验证,取得“成绩单”后,再反馈至上游PG社区。“我们不但出想法,还出实验结果。”这种机制对员工尤其是新人极具吸引力,他们可以在相对宽松的环境中尝试一些“异想天开”的想法,更快地获得成就感和满足感,这是对他们技术追求的一种有效鼓励。IvorySQL 社区在新人友好方面也做了很多工作,比如详细的文档,一步一步的带教等。

对于学生而言,开源贡献正在成为跨越“课堂到职场”鸿沟的跳板。秦建斌教授透露,深大已有学生将改造 PG 里一个 Log 换地址机制作为毕业设计,毕业后直接进入里数据库企业;鼓励学生参加大厂数据库开源相关的活动,推荐直通实习。此外,部分数据库企业在高校设立专项奖学金,激励学生勇于挑战高难度任务;通过以赛促学的方式鼓励学生参加相关比赛;并借助多种社区合作方式,引导学生积极融入社区、多做尝试。

三位高校专家还充分表达了一个共识,企业和开源社区可以传导给学校的资源,最宝贵的还不是钱,而是“有层次的难题库”——那些直接接触客户和场景后产生的、不一定构成大型科研项目但又极具教学价值的真问题。“最难的是找问题,如果企业和社区能把真问题抛出来,高校去想办法解决,解决与否都有价值。”

破局:数据库人才培养,产教融合新生态

这场对话里,我们看到了高校人才培养与产业需求错配的痛点,但更看到了企业、高校、开源社区多方力量的联合沟通与大胆探索。

从瀚高数据库对“开源贡献”和“AI 学习能力”的看重,到武汉大学想方设法为好苗子铺路;从深圳大学用真实内核作业“劝退”又“劝进”学生的硬核课程,到华东师范大学的 Open Source for Education,一个更紧密的产教融合生态正在浮出水面。我们可以期待,当企业和开源社区的“难题库”与高校的“学分制”真正打通,当一个被社区合并的 Feature 可以替代一篇毕业论文,数据库人才培养的“断层线”,就有望从“裂缝”变成“接口”。

吕新杰博士分享,瀚高数据库联合多所高校推动成立“数据库开源发展联盟”,通过奖学金、社区激励、难题库发布等方式与高校建立长效机制。“我们希望瀚高的微薄之力能给开源产业,尤其是开源数据库领域注入新鲜血液,使开源事业在产业界与教育界形成共鸣。大家各自贡献力量,以开源数据库作为载体,未来在整个 IT 行业里做出一点应有的贡献。”

数据库人才的培养,从来不是高校或企业任何一方独立完成的事。当 AI 重塑技能树、开源重构协作方式、国产化倒逼自主可控,这条人才培养链上的每一个环节都需要重新校准,形成合力。

最后,对于学生而言,或许正如专家们所提示的:学好基本功,积极参与到开源社区里,在 Hackers 邮件列表里留下一次认真的发言,在 GitHub 上提交一个被合并的 Patch,这些行动都有重要价值。在数据库内核这个“成长曲线陡峭”的领域里,社区贡献和底层热情,正在成为比学历标签更硬的通行证。

相关阅读

    无相关信息