代码之家 › 专栏 › 技术社区 › Atinesh

使用0pen CV高斯模糊时出错

tesseract image-processing opencv python

Atinesh · 技术社区 · 6 年前

我有一个多页的 .tif 我需要从中提取文本。我想申请 Gaussian blur 提高质量,然后应用 Tesseract OCR 提取文本。在应用高斯模糊时,我的误差小于

代码

from PIL import Image, ImageSequence
from tesserocr import PyTessBaseAPI
import numpy as np
import pycountry
import cv2

with PyTessBaseAPI() as api:
    img = Image.open('sample.tif')

    for i, page in enumerate(ImageSequence.Iterator(img)):
        page2 = np.asarray(page)

        # Gaussian Blur
        imgG = cv2.GaussianBlur(page2, (5,5), 0)  # <---- ERROR

        # Tesseract OCR
        api.SetImage(imgG)
        text = api.GetUTF8Text()

0 回复 | 直到 6 年前

推荐文章

paru kumar · 的可访问性问题。jtessboxeditor中的jar文件

7 年前

Maddy · 如何在python中使用OCR获取图像重绘文本的坐标

7 年前

Tobias Woods · 无法在Mac上安装Tesseract OCR

7 年前

Nihal Saranga · 如何使用pip安装github包链接

7 年前

lucians · OCR:检查字母是否在图像(Opencv、Python、Tesseract)的(字符串)中

7 年前

malsatori · 如何在Python中识别图像中的数字?[已关闭]

7 年前

Darshan Patel · 使用Apache Tika+Tesseract提取扫描PDF的速度较慢

7 年前

Faabass · 无法使tesseract在Centos7上工作

7 年前

CarpeDiemKopi · Tesseract OCR眼睛参数“TesserEdit\u write\u images”

7 年前

Leo128 · JTessBoxEditor不会在Ubuntu 16.04(OpenJDK 8或9)上启动

7 年前