代码之家  ›  专栏  ›  技术社区  ›  Rahul Kishan

如何使用Microsoft制作实时摄像头。媒体ocr具有边框覆盖,用户可以在UWP中触摸并进行文本到语音转换?

  •  0
  • Rahul Kishan  · 技术社区  · 6 年前

    我已经实现了实时摄像头,并使用Android文本识别,当我触摸边界框覆盖时,文本到语音工作,但在通用windows中,应用程序无法获得任何文档。有人能帮助如何在实时摄像头中实现OCR吗?

    1 回复  |  直到 6 年前
        1
  •  0
  •   Sunteen Wu    6 年前

    API来自 Windows.Media.Ocr 命名空间可以从图像中提取文本和文本布局信息。它设计用于处理各种类型的图像。对于照相机,您可以从照相机捕获图像以进行识别。你可以得到 VideoFrame 从照相机转换为图像。

    有关如何在UWP应用程序中实现OCR的更多详细信息,请参考 this sample 。场景2提供了如何从相机捕获图像并提取文本。 有关的更多详细信息 MediaCapture 在UWP应用程序中,请参考 this tutorial

    对于文本到语音功能,请尝试参考 this article this sample

    如果您想要比 Windows。媒体光学字符识别 命名空间,我建议您使用 Microsoft Cognitive Services .检查 近实时分析视频 第节了解更多详细信息。