?最新资讯?
文本识别算法是OCR(Optical Character Recognition)的一个子任务,它的任务是识别一个固定区域的文本内容。有规则文本识别和不规则文本识别两大类。规则文本识别主要指印刷字体、扫描文本等,而不规则文本识别往往出现在自然场景中,存在扭曲、模糊、字体差异等问题。目前在不规则数据集上获得更高指标的算法备受关注。传统的文本识别方法通常分为图像预处理、字符分割和字符识别三个步骤,而基于深度学习的方法具有更优的表现。主流的算法类别包括基于CTC的方法、基于attention的方法和基于transformer的方法,它们在不同的维度上取得了不错的效果。此外,规则文本识别主要有基于CTC的算法和基于Sequence2Sequence的算法两种。基于CTC的算法通过卷积神经网络和双向LSTM进行上下文建模,而基于Sequence2Sequence的算法则利用编码器和解码器进行循环解码。这些算法在文本识别任务中取得了广泛的应用。
来源:https://juejin.cn/ai
原文链接:https://aixinjiyuan.com/524.html,转载请注明出处~~~
评论0