我正在用java中的tess4j阅读一幅带有数学方程的图像。然而,我认为它的字符重叠,无法将英语与方程式结合起来。这是一个训练有素的数据问题吗?我怎样才能解决这个问题。下面是我的代码。
ITesseract tess = new Tesseract();
try {
tess.setLanguage("eng+equ");
String imageURL = "http://www.blah.com/images/test-exercises/exercises.png";
URL url = new URL(imageURL);
BufferedImage img = ImageIO.read(url);
String result = tess.doOCR(img);
System.out.println(result);
} catch (TesseractException e) {
e.printStackTrace();
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
我得到的输出
a) â¥ââââ¥â®â¥â¸â£â½â k) â¥â
âââ£âââ
â¸âââ£â®â¸â
â â½ââ
â ââ
â¸
3x â¸â ⸠e
7 4:7, â â z, 77
b) 1+ 1 1 1) 3â z») ââââ
⥠⥠â
r) 17:71:3770 m) â©â
â£âââ
ââ¥â»â£â
ââââââ®â¼â´
3 .
d) â¼â´ââ£ââ®â¥â¥âââ¥â n) âââââ®â¹âââ¢ââ
ââ¢â¢â©ââ»
9) Liz: o) âââ¨ââââ
â¸â®â¥ââ
âââââ¥ââ