- 使用来自中国科学技术大学和科大讯飞研究院的基于GraphDoc的解决方案的团队赢得了Rossum的DocILE竞赛,展示了在文档信息提取方面的突破性技术。
- 比赛强调了计算机视觉和转换器体系结构之间的协同作用,强调了在处理复杂业务文档时需要采用全面策略的必要性。
- Rossum的DocILE倡议激发了协作、创新,并为智能文档处理确立了全球基准,加强了该公司在推进这一领域研究方面的承诺。
伦敦, 2023年9月25日 —— 作为智能文档处理行业的领导者,Rossum对其开创性的DocILE(文档信息定位和提取)竞赛取得的卓越成果感到非常兴奋。这个于2022年2月启动的全球性活动,对文档处理领域留下了难以磨灭的印记。

Rossum 在2022年启动了DocILE倡议,提供了对超过6,700份经过精心注释的业务文档的访问权限,此外还提供了10万份合成生成的文档。
这个前所未有的基准数据集为全球参与者提供了检验解决方案的试金石,使他们能够衡量其解决方案与既定方法论的对比。一年来,各种团队利用这个数据集来提高他们在半结构化业务文档中准确定位关键数据(如增值税号和公司地址)的能力。
竞赛于2023年5月24日结束,吸引了广泛的提交作品。参与者通过创建各种方法来展示他们在文档信息提取方面的创新,以应对复杂的业务文档中固有的挑战。
来自中国科学技术大学和科大讯飞研究院的团队提出了一种称为“GraphDoc”的方法,在关键信息定位和提取(KILE)以及行项目识别(LIR)任务中都获得了第一名,与其他参与者拉开了明显的差距。
他们的成功得益于创新性的转换器架构使用,这在比赛中给了他们飞跃性的头 start。他们引入了一个引人注目的技术,涉及学习哪些词必须组合在一起才能得到正确的提取值,并利用基于数据趋势的启发式方法进一步增强了结果。
比赛中出现了各种不同的方法,有些依靠计算机视觉,有些依靠转换器架构,这表明后者在该领域的普及度正在上升。更重要的是,比赛证明,由于纯计算机视觉方法和只处理文本的传统转换器无法达到相同的性能,因此有必要同时将文档理解为图像和它所包含的文本。
通过组合这两种方法,参与者能够对复杂的业务文档达到更深入和更准确的理解,其中计算机视觉解决了特定的挑战,而转换器处理了不同的方面。这强调了需要一种全面策略的必要性,这种策略要考虑到文档的文本和视觉结构,以进行精确的解释。
Rossum的研究科学家Štěpán Šimsa对比赛的影响表示热情,他说:“DocILE倡议不仅激发了开创性的研究,还促进了行业协作和创新。通过弥合方法论差距,我们正在赋能智能文档处理社区开发革命性业务运营的解决方案。”
作为比赛的一部分,参与者必须开源他们的代码并发表论文描述他们应用的方法。奖金池由8000美元组成,其中6000美元颁发给获得第一名奖以及“最佳论文奖”的获胜GraphDoc解决方案。
这场比赛体现了Rossum在全球范围内加速智能文档处理领域发展的坚定使命,为文档理解确立基准。该倡议充当催化剂,激发创造新技术的火花,这些技术可以增强文档信息提取的精确性和效率——这证明了Rossum创新和卓越的核心价值观。
关于Rossum
Rossum是领先的智能文档处理(IDP)解决方案供应商,将行业中最先进的数据提取功能与完整的低代码平台相结合,可以自动化公司文档处理工作流程中的大量手动工作。 从Bosch、Morton Salt到日本的The Master Trust Bank等数百家不同规模和行业的组织都使用Rossum来减少手动工作、改善周转时间和消除错误。 欲了解更多信息,请访问 www.rossum.ai。
关于DocILE倡议
DocILE(文档信息定位和提取)倡议正在推动智能文档处理(IDP)的进步。通过为文档理解中的机器学习方法创建大规模的研究基准,该倡议促进了协作、创新和尖端技术的开发。
DocILE于8月在加利福尼亚举行的最大的文档理解会议“国际文档分析和识别会议”(ICDAR)上启动,它在研究社区中引起了极大的兴趣,承诺会加快AI技术的发展,这些技术可以革命性地改变IDP。
媒体联系人:
Rami Deeb
rami.deeb@rossum.ai
+352 621 510 930
来源 Rossum