代码之家  ›  专栏  ›  技术社区  ›  Amnon

可以使用a2i的crowd textract analyze文档突出显示自定义提取吗?

  •  0
  • Amnon  · 技术社区  · 4 年前

    我想为使用amazontextract进行OCR和使用amazonclude进行实体提取的图像创建一个人类审查循环。

    我的过程是:

    1. 发送文本以提取实体
    2. 在Textract的输出中找到由implement提取的实体的块id
    3. KEY_VALUE_SET per the docs
    4. 使用创建人工任务 crowd-textract-analyze-document 元素,并将修改后的textract输出提供给它

    在这个过程中失败的是第5步。我的自定义实体未正确呈现。我所说的“无法工作”是指当我在侧边栏上单击实体时,它们不会在图像上突出显示。浏览器控制台中没有错误。

    有人试过这样的事吗?

    0 回复  |  直到 4 年前
        1
  •  1
  •   Amnon    4 年前

    我使用了 a2i-crowd-textract-detection human task element 以产生 initialValue 属性。该属性的文档似乎不正确。而doc显示的值应该与Textract的输出格式相同,即:

    [
            {
                "BlockType": "KEY_VALUE_SET",
                "Confidence": 38.43309020996094,
                "Geometry": { ... }
                "Id": "8c97b240-0969-4678-834a-646c95da9cf4",
                "Relationships": [
                    { "Type": "CHILD", "Ids": [...]},
                    { "Type": "VALUE", "Ids": [...]}
                ],
                "EntityTypes": ["KEY"],
                "Text": "Foo bar"
            },
    ]
    

    这个 a2i-crowd-textract-detection

    [
            {
                "blockType": "KEY_VALUE_SET",
                "confidence": 38.43309020996094,
                "geometry": { ... }
                "id": "8c97b240-0969-4678-834a-646c95da9cf4",
                "relationships": [
                    { "Type": "CHILD", "ids": [...]},
                    { "Type": "VALUE", "ids": [...]}
                ],
                "entityTypes": ["KEY"],
                "text": "Foo bar"
            },
    ]
    

    推荐文章