?最新资讯?
机器之心报道,我们在阅读论文或科学文献时常常会遇到PDF格式的文件。然而,将存储在PDF中的信息转换成其他格式是一件困难的事情。特别是对于数学公式来说更是如此。但是现在,Meta AI推出了一款名为Nougat的OCR神器,它能够解决这个难题。Nougat基于Transformer模型构建,可以轻松地将PDF文档转换为MultiMarkdown格式,甚至可以处理扫描版的PDF和复杂的数学公式。该神器不仅可以识别文本中的简单公式,还可以准确地转换复杂的数学公式,包括上标、下标等各种数学格式。此外,Nougat还能识别表格和扫描产生的畸变文本。不过需要注意的是,Nougat生成的文档中不包含图片。详细内容请阅读完整文章。
来源:https://zhuanlan.zhihu.com/jiqizhixin
原文链接:https://aixinjiyuan.com/471.html,转载请注明出处~~~
评论0