代码之家  ›  专栏  ›  技术社区  ›  user3310115

使用英语和经过方程式训练的数据tesseract Tesser4j

  •  4
  • user3310115  · 技术社区  · 5 年前

    我正在用java中的tess4j阅读一幅带有数学方程的图像。然而,我认为它的字符重叠,无法将英语与方程式结合起来。这是一个训练有素的数据问题吗?我怎样才能解决这个问题。下面是我的代码。

     ITesseract tess = new Tesseract();
            try {
                tess.setLanguage("eng+equ");
                String imageURL = "http://www.blah.com/images/test-exercises/exercises.png";
                URL url = new URL(imageURL);
                BufferedImage img = ImageIO.read(url);
                String result = tess.doOCR(img);
                System.out.println(result);
            } catch (TesseractException e) {
                e.printStackTrace();
            } catch (MalformedURLException e) {
                e.printStackTrace();
            } catch (IOException e) {
                e.printStackTrace();
            }
    

    我得到的输出

    a) ↥⊝≍⋉↥⋮↥↸⊣⊽≍ k) ↥⋅⊈⋉⇣≁⇃⋅↸≍⋉⇣⋮↸⋅∠⊽≁≍
    ⊔ ⇃⋅↸
    3x ↸≍ ↸ e
    7 4:7, ≓ ≓ z, 77
    b) 1+ 1 1 1) 3” z») ∙≁−−
    ↥ ↥ ⋅
    r) 17:71:3770 m) ≩∅⊣⇇⋜∅≁↥≻⊣∅≁⊈⋗⋉↖⋮↼↴
    3 .
    d) ↼↴≍⊣⋜⋮↥↥≍⋉↥∘ n) ⊈⇉≁≍⋮≹⋜⋉⊢⇃⋅∖⊢⊢≩≍≻
    9) Liz: o) ⇇⋜↨≍≁⊈⋅↸⋮↥∘⋅−≁⊈⋉↥≟≍
    

    Image Used for testing

    0 回复  |  直到 5 年前
    推荐文章