代码之家  ›  专栏  ›  技术社区  ›  zelusp

限制Google Cloud Vision的角色集

  •  0
  • zelusp  · 技术社区  · 4 年前

    我什么也没看到 documentation 关于能够指示OCR解析器仅返回 Latin-1 字符(编码 just the first 256 code points of the Unicode character set )例如,OCR解释了 " 双引号为 ” 看起来很像双引号,但是 unicode 性格 \u201d .

    限制字符集可能是改进OCR(假设文档预期使用某种语言)并使下游文本处理更可预测的好方法。这可能吗?

    0 回复  |  直到 4 年前