代码之家 › 专栏 › 技术社区 › briarheart

使用token_Count字段计算n个grams

elasticsearch-5 elasticsearch

briarheart · 技术社区 · 5 年前

是否可以使用 token_count 田野? 假设我有以下映射:

{
  "settings": {
    "analysis": {
      "filter": {
        "trigrams_filter": {
          "type": "ngram",
          "min_gram": 3,
          "max_gram": 3
        }
      },
      "analyzer": {
        "trigrams": {
          "type": "custom",
            "tokenizer": "standard",
            "filter": ["lowercase", "trigrams_filter"]
          }
      }
    }
  }, 
  "mappings": {
    "doc": {
      "properties": {
        "message": {
          "type": "text",
          "analyzer": "trigrams",
          "fields": {
            "length": { 
              "type": "token_count",
              "analyzer": "trigrams"
            }
          }
        }
      }
    }
  }
}

有了这个映射,我希望“quick”的值有三个术语:“qui”、“uic”和“ick”,但是下面的查询不会返回任何hit,尽管事实上 message.length 字段有 trigrams 分析仪:

{
  "query": {
    "term": {
      "message.length": 3
    }
  }
}

0 回复 | 直到 5 年前

推荐文章

silent phantom · Elasticsearch动态模板未按要求工作

6 年前

Pankaj Sharma · 如何实现Haystacksearch获取的自动完成

6 年前

Ashish Yadav · 如何在弹性搜索中获取嵌套对象的数组计数

6 年前

Aviran · 筛选ID值

6 年前

Patrick · 使用完整的suggester和德语分析器进行搜索

6 年前

andy · Elasticsearch-获取子文档的计数,即使计数为零

6 年前

Omarkad · 在查询elasticsearch中访问字段文档

6 年前

flalar · 从SQL转换为elasticsearch查询

6 年前

swap310 · Elasticsearch字段上的总和和计数聚合

6 年前

ehsan shirzadi · 按日期范围分组的Elasticsearch计数

6 年前