2023-06-16 15:30:51
近年来随着深度学习的不断前进,包括场景文本检测与识别技术在内的光学字符识别(Optical Character Recognition,OCR)得到了飞速发展。然而,印章这一生活办公中随处可见的重要元素却未获得关注,印章抬头识别这一重要课题也面临各式各样的印章形状、弯曲的文本内容、复杂的背景要素以及无处不在的重叠文本等诸多难题。今年举办的第17届ICDAR国际学术竞赛中,就设置了印章抬头识别竞赛板块,为针对性解决印章抬头文本检测和端到端印章抬头文本内容识别痛点寻求方案。
ICDAR(International Conference on Document Analysis and Recognition)是全球文档图像分析识别领域公认的权威学术会议,也是世界上举办最早和最成功的OCR赛事之一,更是评测和检验自然场景/网络图片文本自动提取与智能识别最新技术研究进展的重要国际赛事及标准。ICDAR系列赛事的高技术难度、高实际应用性,备受众多科研院校、科技公司的广泛关注,赛事举办至今已有119个国家的7821多支队伍参与其中,持续为OCR技术发展注入推动力量。
本次大赛的2023印章抬头识别竞赛板块(ICDAR 2023 Reading the Seal Title)由多位领域专家组织展开,实在智能作为AI领域的准独角兽企业,凭借在人工智能领域深耕多年的丰厚经验和领先的技术方案,与浙江大学、中国科学院信息工程研究所、中国移动云中心等优秀单位共同位列十强!
实在智能此次参赛的解决方案,是基于先前领域内研究成果进一步创新提出的“两阶段”的识别方法:第一阶段检测弯曲文本方案提出以五阶的贝塞尔曲线拟合弯曲文本,实验证明这一改进取得了更好的拟合效果;第二阶段对抬头文本的识别中设计了更强大的骨干网络,增对各个印章类型设计了在线增强策略,合成了10万张合成数据用于训练,最终在Task 2. End-to-end Seal Title Recognition 任务上排名挺进前十。此次竞赛中的优秀成绩,再一次彰显了实在智能突出的全自研OCR能力。
目前,实在智能已结合产品落地经验和收集的语料,继续迭代优化了OCR检测和识别模型,实现了自有的通用文字识别、表格识别、键值抽取、通用证照、印章识别等功能,其AI产品IDP文档审阅正是通过运用光学字符识别(OCR)、自然语言处理能力(NLP)等前沿技术为核心的文本智能处理智能产品,应用于信息电子化、风险预警等业务领域,为赋能更多行业数字化升级转型带来场景解决方案。
在此基础上,实在智能近期还融合人工智能领域前沿的大型语言模型(LLM)和OCR、NLP等核心技术,进一步赋能IDP文档审阅,推出了首款能够自动读懂文档并与用户交流对话的Chat-IDP。
Chat-IDP是借助行业领先AI能力,OCR、NLP、LLM等核心技术,实现AI处理文档的一款智能产品,能够自动分析内容密集、篇幅长、非结构化的文档,从而实现内容风险审查、智能归档、关键信息抽取、比对,创新打造了智能文本审核的全新范式,进一步优化了AI能力边界,提升用户的交互使用体验,以更自动化、智能化的文档审阅流程节省人工阅读文档以及检索关键信息的精力以及时间成本,在确保95%以上准确率的基础上,帮助业务人员实现效率提升超5倍的智能文档审核工作。
值得一提的是,实在智能在OCR、NLP、CV等关键技术方面均已取得重要突破,拥有位居行业第一的数百项独立自主知识产权和数十项实际授予发明专利。今后,实在智能也将基于大型语言模型领域的开发能力与经验,继续坚持客户第一的价值观,在全面支持信创的实在RPA产品体系中整合进大型语言模型技术,加速实现部分领域的“即说即所得”服务能力,以创新的交互方式与技术能力确保为千行百业的客户打造契合多重场景需求的AI落地应用,助其轻松上手各类数字化工具。