代码之家  ›  专栏  ›  技术社区  ›  Sharvari Gc

ocr误差置信水平

  •  0
  • Sharvari Gc  · 技术社区  · 4 年前

    我正在使用:

    text = pytesseract.image_to_data(ROI, output_type='data.frame')
    

    并尝试从返回值中使用-'conf'列。然而,我看到它不是准确的很多次。我该怎么修?

    正如你在图片中看到的,我试图阅读18.40欧元,但它的回报和60%的信心水平错误的结果-13.40欧元。所以,我有点困惑,如何从这一点着手提炼结果?

    我已经用过了-

    1. 自适应阈值:

      im=cv2.adaptiveThreshold(image,255,cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY,111,3)
      
    2. x、 y,w,h=int(数据['x']),int(数据['y']),int(数据['w']),int(数据['h'])

      ROI=阈值[y:y+h,x:x+w]

      text=pytesseract.image到数据(ROI,output type='data.frame')

    enter image description here

    0 回复  |  直到 4 年前