代码之家 › 专栏 › 技术社区 › mandok

降低图片中的噪波,使用tesseract启用OCR

tesseract ocr imagemagick image-processing

mandok · 技术社区 · 6 年前

我正在尝试对此类图像进行OCR:

不幸的是,tesseract无法检索数字,因为字符周围有噪声点。

我尝试使用ImageMagick来提高图像质量,但没有成功。

示例:

 convert input.tif -level 0%,150% output.tif

 convert input.tif -colorspace CMYK -separate output_%d.tif

有没有办法有效地检索此类图像中的字符?

非常感谢。

2 回复 | 直到 6 年前

flamelite 6 年前

易于理解的 closing operation (先膨胀后侵蚀)将提供所需的输出。下面是相同的Python实现。

img = cv2.imread(r'D:\Image\noiseOCR.png',0)
kernel = np.ones((3,3),np.uint8)
closing = cv2.morphologyEx(img, cv2.MORPH_CLOSE, kernel)

LiberiFatali 6 年前

此图像中的数字是最大的连接组件。因此,另一种方法是进行连接组件分析。

推荐文章

Rahul Kishan · 如何使用Microsoft制作实时摄像头。媒体ocr具有边框覆盖,用户可以在UWP中触摸并进行文本到语音转换?

6 年前

Casper · MNIST OCR的图像预处理

6 年前

mandok · 降低图片中的噪波,使用tesseract启用OCR

6 年前

Rodrigo Pelissier · 如何将TesseractOCRiOS与西班牙语结合使用?

6 年前

Snake · 将google vision api文本检测限制在特定区域

6 年前

Bunnies_Nothing · 允许空格的17位正则表达式

6 年前

Kilazur · 使用数据库定位器在单个列上进行搜索,可信度是否正确?

6 年前

Maddy · 如何在python中使用OCR获取图像重绘文本的坐标

7 年前

Sean · OCR:低对比度/噪声区域

7 年前

S. A. · 在后台运行Automator工作流

7 年前