?最新资讯?
有了 Nougat,再也不用担心阅读论文或科学文献时的复杂数学公式了。Meta AI最新推出的OCR神器Nougat,基于Transformer模型构建,能够将PDF文档轻松转换为MultiMarkdown,同时也能处理扫描版的PDF,让数学公式转换变得轻而易举。Nougat不仅可以识别文本中的简单公式,还能准确地转换复杂的数学公式。即使公式中含有上标、下标等各种数学格式,Nougat也能分辨清楚。此外,Nougat还能识别表格和处理扫描文本的畸变。唯一的遗憾是Nougat生成的文档中不包含图片,但转换效果确实令人惊叹。关于Nougat的方法概述,本文介绍了其基于编码器-解码器Transformer架构的设计,以及数据集的构建和处理过程。Nougat的训练过程中还采用了数据增强技术来提高泛化能力。在构建数据集时,研究团队从arXiv和PubMed Central等来源获取文章,并将其转换为Markdown格式。对于PDF中的图形和表格,团队通过预处理步骤将其删除,以确保与源代码的匹配。最后,团队使用词袋模型和线性支持向量机分类器进行了页码预测。总的来说,Nougat的推出为解决PDF转换中的数学公式难题提供了一种高效的解决方案,对于学术党来说是个喜讯。
来源:https://www.jiqizhixin.com/
原文链接:https://aixinjiyuan.com/472.html,转载请注明出处~~~
评论0