代码之家  ›  专栏  ›  技术社区  ›  gbjbaanb

双变音错误

  •  0
  • gbjbaanb  · 技术社区  · 16 年前

    我在用 Lawrence Philips Double-Metaphone 算法非常成功,但我发现了一些组合的奇怪的“意外结果”。

    是否有其他人对算法的其他部分进行了添加或更改,他们不介意共享,或者只是他们发现无法按预期工作的组合。

    我的问题是:

    • Peashill和Bushley。(均与PXL匹配)
    • Rockliffe和Rockcliffe(Rklf和Rkl)
    2 回复  |  直到 13 年前
        1
  •  5
  •   Jonathan Leffler    16 年前

    所有Soundex、隐喻和变体方案偶尔都会给出与预期不一致的结果。这是不可避免的-它们可以被视为或多或少简单的哈希算法,具有特殊的信息保存属性,有时会在您不愿意时产生冲突,有时会在您不愿意时产生差异。

    改进事物的一种可能方法是使用“同义词环”。这基本上产生了应被视为同义词的单词列表,与拼写无关。我在名称匹配的上下文中遇到了它们。例如,Chaudri上的变体 包括:

    乔杜里 乔德里 乔杜里 乔杜里 乔德里 乔德里 乔德里 乔杜里 乔杜里 乔杜里 乔迪 乔德里 乔德里 乔德里 乔杜里 查德哈里 查德里 查德里 切德 喉咙 查德哈里 杂耍 乔德里 乔德里 乔德里 乔德里 乔达里 乔达里 乔德里 肖达里 乔达里 乔德里 乔杜里 乔德里 乔德里 乔杜里 乔杜里 查德里 乔德里 乔德里 乔杜里 肖维德里 乔达里 乔达里 乔达里 乔德里 乔德里 乔德里 乔德胡里 乔德胡里 乔杜里 乔德里 乔德莱 乔德里 乔德里 乔德里 杂种 乔杜里 乔德里 丘达里 丘德里 丘达里 考德里

        2
  •  -1
  •   Brian    15 年前

    常规隐喻正回归Peashill和Bushley之间的差异。

    皮亚希尔PXL 布什利BXL