2024-03-21 16:36:49 互联网
传承中华文脉,古籍是重要的载体。据统计,中国是全球拥有古籍最多的国家。然而,当代人面对浩如烟海的古籍,又存在“找不到、不会用、读不懂”等难题。近日,由字节跳动研发的“识典古籍”数字化平台上线智能助手功能,试图通过人工智能大模型技术,提升古籍查阅效率,让更多普通人读懂古籍,助力古籍保护与传承。
用户打开“识典古籍”官网即可免费体验这项新功能,当遇到读不懂的古文语句时,点击“问AI”,就可以看到这句话的翻译,还可以用日常说话的方式,让智能助手总结文本内容,提出可供参考的研究问题,进行跨古籍提问等。如用户提问“我想找跟北京相关的古籍”,智能助手就会通过语义检索“识典古籍”的资料库,给出解答,直接在回答中显示引用的参考资料和原文链接。
据“识典古籍”产品负责人王宇介绍,古籍保护与文化传承一直是字节跳动公益重点关注的领域。“识典古籍”平台一方面是一个面向社会公众的数字化古籍阅读工具,同时也是一个开放的古籍数字化智能整理平台。“从2022年上线到现在,我们根据用户的反馈对平台功能进行了一系列优化。我们也在探索一些更高效的方式,开发更好的产品和工具,帮助大家更好地阅读和理解古籍。此次依托大语言模型技术,上线古籍智能助手,也是我们在这一领域的思考和创新。”
据不完全统计,我国现存古籍约有20万种,其中有数字化扫描影像的有8万种,实现文本数字化的仅有3-4万种左右。由于古籍种类、数量繁杂,保存程度不一,加之从事古籍修复的专业人员数量不足、资金匮乏等多重原因,古籍资源的挖掘传承保护工作仍面临巨大压力。
2021年,字节跳动公益就发起“寻找古籍守护人”活动,邀请来自不同领域的专家学者、文化名人和抖音达人,共同推动古籍保护。2022年,字节跳动启动了古籍数字化的工作,真正实现古籍从纸质到数字化的迁移。当年10月,字节跳动联合北京大学数字人文实验室共同打造的古籍数字化阅读平台“识典古籍”正式上线。
“识典古籍”上线以来,收到了许多文史爱好者与研究者的正面反馈与支持。有报道指出,“识典古籍”平台不仅是一个公益性数字化平台,对于古籍爱好者尤其是专业研究人员来说,其更是一座横跨千年历史的知识宝库。目前,该平台对社会免费开放的古籍超过了2900部,其提供的分词检索、图文对照、字典释义等功能,让普通人也能轻松阅读古籍文献。
此次“识典古籍”智能助手的上线,进一步降低了古籍的阅读门槛,让流传千百年的宝贵文献走入寻常百姓家。同时,以古籍智能助手为代表的人工智能工具,也为古籍数字化工作带来了机遇。“我们所处的新时代,有可能实现文化典籍永久保护和传承”,有业内人士表示。
据了解,目前“识典古籍”除了网页版,今日头条产品侧还设置了“古籍”频道。由于公益项目的延展性,在字节跳动内部,有很多不同业务板块的员工参与其中,为此还专门成立了一个古籍保护公益社团。这种开放、协作的氛围,也是平台在两年时间内实现上线并不断优化的基础。
下一步,“识典古籍”研发团队将有计划地为古籍智能助手开发更多的工具。除此之外,该团队还将继续提升AI在古籍整理等领域的应用,希望能够整理和校对更多的古籍,并将其数字化,促进古籍资源的高效利用,让平台在文化传承中发挥更大的作用。按计划,到2025年,“识典古籍”将陆续完成一万种古籍的智能化整理工作,基本覆盖儒家、道家和佛学的核心典籍目录,届时将全部免费开放。