代码之家 › 专栏 › 技术社区 › Sharvari Gc

ocr误差置信水平

python-tesseract tesseract ocr

Sharvari Gc · 技术社区 · 4 年前

我正在使用:

text = pytesseract.image_to_data(ROI, output_type='data.frame')

并尝试从返回值中使用-'conf'列。然而,我看到它不是准确的很多次。我该怎么修?

正如你在图片中看到的,我试图阅读18.40欧元,但它的回报和60%的信心水平错误的结果-13.40欧元。所以,我有点困惑,如何从这一点着手提炼结果?

我已经用过了-

自适应阈值:

im=cv2.adaptiveThreshold(image,255,cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY,111,3)

x、 y,w,h=int(数据['x']),int(数据['y']),int(数据['w']),int(数据['h'])

ROI=阈值[y:y+h,x:x+w]

text=pytesseract.image到数据(ROI,output type='data.frame')

0 回复 | 直到 4 年前

推荐文章

Rahul Kishan · 如何使用Microsoft制作实时摄像头。媒体ocr具有边框覆盖,用户可以在UWP中触摸并进行文本到语音转换?

6 年前

Casper · MNIST OCR的图像预处理

6 年前

mandok · 降低图片中的噪波,使用tesseract启用OCR

6 年前

Rodrigo Pelissier · 如何将TesseractOCRiOS与西班牙语结合使用?

7 年前

Snake · 将google vision api文本检测限制在特定区域

7 年前

Bunnies_Nothing · 允许空格的17位正则表达式

7 年前

Kilazur · 使用数据库定位器在单个列上进行搜索,可信度是否正确?

7 年前

Maddy · 如何在python中使用OCR获取图像重绘文本的坐标

7 年前

Sean · OCR:低对比度/噪声区域

7 年前

S. A. · 在后台运行Automator工作流

7 年前