代码之家  ›  专栏  ›  技术社区  ›  user2696565

Pytess直立错误:找不到文件,TesseractNotFounderror

  •  0
  • user2696565  · 技术社区  · 6 年前

    我试图在python中使用pytesseract,但最终总是出现错误:

    “TesseractNotFounderror:未安装Tesseract或它不在您的路径中”

    pytesseract和tesseract安装在系统中。我是python新手,如果有人能帮我做这个我会很感激的

    0 回复  |  直到 5 年前
        1
  •  26
  •   Sociopath    6 年前

    我尝试像其他人提到的那样添加到path变量,但仍然收到相同的错误。把这个添加到我的脚本中是有效的:

    pytesseract.pytesseract.tesseract_cmd=r“c:\程序文件 (x86)Tesseract OCR\Tesseract.exe“

        2
  •  16
  •   Ali    5 年前

    因为我安装了 pytesseract 具有 pip 但是忘了安装它 apt .

    关于Ubuntu:

    sudo apt update
    sudo apt install tesseract-ocr
    sudo apt install libtesseract-dev
    

    在Mac上:

    brew install tesseract
    
        3
  •  10
  •   divibisan    6 年前

    你可能失踪了 tesseract-ocr 从你的机器上。请检查此处的安装说明: https://github.com/tesseract-ocr/tesseract/wiki

    在Mac上,只需使用自制程序即可安装:

    brew install tesseract

    之后应该会好起来的

        4
  •  6
  •   Louis Lin    6 年前

    我在Mac OS上运行,并在Brew中安装了Tesseract,下面是我的看法。由于pytesseract正是从python访问tesseract的方式,因此必须指定tesseract在计算机上的位置。

    对于Mac OS

    尝试查找tesseract.exe的位置-如果使用 酿造 ,在您的终端上使用:

    >brew list tesseract
    

    这应该列出tesseract.exe的位置,大致类似于

    > /usr/local/Cellar/tesseract/3.05.02/bin/tesseract
    

    Then following their instructions :

    pytesseract.pytesseract.tesseract_cmd = r'<full_path_to_your_tesseract_executable>'
    

    pytesseract.pytesseract.tesseract_cmd=r'/usr/local/cell/tesseract/3.05.02/bin/tesseract'

    应该做的把戏!

        5
  •  5
  •   ah bon    6 年前

    在Windows 10 OS环境下,以下方法对我有效:

    1. https://github.com/tesseract-ocr/tesseract/wiki 下载Tesseract并安装它。此处提供Windows版本: https://github.com/UB-Mannheim/tesseract/wiki

    2. 从C:\users\user\anaconda3\lib\site packages\pytesseract中找到脚本文件pytesseract.py并将其打开。 更改以下代码 tesseract_cmd = 'tesseract' 到: tesseract_cmd = 'D:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

    3. 您可能还需要添加环境变量 D:/Program Files (x86)/Tesseract-OCR/

    希望对你有用!

        6
  •  4
  •   evanca    6 年前

    在jupyter笔记本中,有一件事对我很有用,那就是 双反斜杠 而不是pytesseract.pytesseract.tesseract_cmd路径中的单个反斜杠:

    pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
    
        7
  •  3
  •   Nino Filiu    6 年前

    我也面临同样的问题。我希望你已经安装了 here 而且也做到了 pip install pytesseract .

    如果一切都好,你应该看到 C:\Program Files (x86)\Tesseract-OCR where tesseract.exe 有空。

    添加路径变量对我没有帮助,我实际上添加了名为 tesseract 在值为的环境变量中 C:\Program Files (x86)\Tesseract-OCR\tesseract.exe .

    打字 小精灵 在命令行中,现在应该可以通过提供使用信息来按预期工作。你现在可以使用 pytesseract 因此(在运行之前不要忘记重新启动python内核!):

    import pytesseract
    from PIL import Image
    
    value=Image.open("text_image.png")
    text = pytesseract.image_to_string(value, config='')    
    print("text present in images:",text)
    

    享受!

        8
  •  2
  •   Codemaker2015    6 年前

    您可以使用以下链接下载Tesseract OCR安装程序,

    Tesseract for windows

    然后在环境变量中添加名为tesseract的新变量,值为c:\ Program Files(x86)\ tesseract ocr\tesseract.exe

        9
  •  2
  •   Fachi Vivekanand Panda    6 年前

    我也面临同样的问题。我只是用这个命令来帮助我。

    sudo apt install tesseract-ocr
    

    注意,这只适用于ubuntu。
    sudo 是一个unix专用命令(linux、mac、rasbian等) apt 是ubuntu特有的。

        10
  •  1
  •   Ranjan Kumar    6 年前

    从安装Tesseract https://github.com/UB-Mannheim/tesseract/wiki 并将tesseract.exe的路径添加到 路径 环境变量。

        11
  •  1
  •   Mihir Verma    5 年前

    Mac:

    1. 安装pytesseract( pip安装pytesseract 应该工作)
    2. 安装Tesseract 但是,只有在自制的情况下,pip安装不知何故不起作用。 . ( brew安装tesseract )
    3. 获取在设备上安装Tesseract的brew路径( Brew列表Tesseract )
    4. 添加路径 进入你的代码,而不是系统路径 . 路径将与代码一起添加,使用pytesseract.pytesseract.tesseract_cmd='<步骤3中接收的路径>'-(例如。 pytesseract.pytesseract.tesseract_cmd='/usr/local/cell/tesseract/4.0.0_1/bin/tesseract' )

    这应该行得通。

        12
  •  0
  •   Zamar    6 年前

    你正在导入

    from tesseract import image_to_string
    

    不从pytesseract导入

        13
  •  0
  •   Lovepreet Singh    6 年前

    我也面临同样的问题 C:\Program Files (x86)\Tesseract-OCR 到你的路径变量。 如果仍然不起作用,请添加 C:\Program Files (x86)\Tesseract-OCR\tessdata 到新行中的路径变量。并且不要忘记在添加路径变量后重新启动计算机。

        14
  •  0
  •   noBee    6 年前

    我目前正在使用windows,需要开发一个pdf解析器,但是通过 sysdm.cpl 一个人不行。对于其他windows用户,我强烈建议添加 C:\Program Files (x86)\Tesseract-OCR 对你 profile.ps1 同样(如果使用的是powershell)。

        15
  •  0
  •   Schalton    6 年前

    小错误——我知道我必须打开/关闭我的CMD才能得到更新的路径来反映。使用jupyter笔记本,我不得不关闭客户端并重新初始化它。

        16
  •  0
  •   Shivam Bharadwaj    6 年前

    以下三个命令将执行必要的操作:

    sudo apt update
    # This will update your packages
    sudo apt install tesseract-ocr
    # This will install OCR
    sudo apt install libtesseract-dev
    # This will add it as development dependency
    
        17
  •  0
  •   Andrew Ravus    5 年前

    很可能安装了不同版本的python,请确保安装的tesseract位于同一python版本上。

    which pip3 显示pip3安装的路径,以及 which python3 显示了python安装的相应路径。

    确保这两个是相同的。