🆕最新资讯🆕
LayoutLM是一种用于在扫描文档图像中共同建模文本和布局信息的预训练模型。在过去的几年中,预训练技术在自然语言处理(NLP)任务中取得了成功。然而,现有的预训练模型主要关注文本级别的操作,忽视了对于文档图像理解至关重要的布局和样式信息。LayoutLM通过利用图像特征将单词的视觉信息合并到预训练模型中,可以在多个文档图像理解任务上取得最先进的结果。本文介绍了LayoutLM的架构和多任务学习目标,以及它在表单理解、收据理解和文档图像分类等任务上的性能提升。LayoutLM的提出填补了文档级别预训练的空白,为自动化文档处理工作流程提供了新的解决方案。
来源:https://juejin.cn/ai
原文链接:https://aixinjiyuan.com/723.html,转载请注明出处~~~
评论0