代码之家  ›  专栏  ›  技术社区  ›  Pete Alvin

Net支持短语:在索引过程中,用什么方法来标记字段中逗号分隔的数据(原子地)?

  •  1
  • Pete Alvin  · 技术社区  · 14 年前

    我有一个数据库,其中有一列我想索引,它有逗号分隔的名称,例如。,

    User.FullNameList = "Helen Ready, Phil Collins, Brad Paisley"
    

    我更喜欢把每个名字都标记出来 原子的 (名称作为一个整体可搜索实体)。最好的方法是什么?

    1. 我错过了一个简单的设置选项吗 标记化分隔符?
    2. 子类化或编写自己的类 那是我自己的标记器吗?
    3. 还有别的吗?;)

    或者Lucene.net不支持短语?

    或者它是否足够聪明来自动处理这个用例?

    ***编辑:使用我的示例,我希望将这些名称短语存储在单个字段中:

    菲尔柯林斯

    布拉德·派斯利

    海伦

    准备好的

    菲尔

    柯林斯

    布拉德

    2 回复  |  直到 14 年前
        1
  •  1
  •   Yuval F    14 年前

    编辑: 在阅读了您的澄清之后,希望这里有一个更相关的答案:

    1. 您没有错过修改分隔符字符的选项。
    2. 你需要使用你自己的标记器。我建议你把 CharTokenizer
        2
  •  0
  •   bajafresh4life    14 年前

    你可以自己用逗号分隔字符串,并且--