代码之家  ›  专栏  ›  技术社区  ›  joebert

快速字符检测

  •  1
  • joebert  · 技术社区  · 15 年前

    我不想知道它说了什么,它也不会像验证码那样处理任何失真,我只想知道 图像中包含任何文本。

    这是将在几个空闲的Linux服务器上运行的,cron作业将每天处理大量图像多次。

    在这个过程中,我想做的一件事就是丢弃其中包含文本的任何图像。我不介意有一些误报,但我希望在识别图像时尽可能接近百分之零的失败率。

    1 回复  |  直到 15 年前
        1
  •  2
  •   J-16 SDiZ    15 年前

    这个 Tesseract-OCR 是谷歌用于谷歌图书的。试一试。