代码之家  ›  专栏  ›  技术社区  ›  jamesaharvey

什么是最好和最活跃的开源.Net搜索技术?

  •  42
  • jamesaharvey  · 技术社区  · 15 年前

    我正试图为一个.Net项目决定一种开源搜索/索引技术。Java项目的标准似乎是Lucene,但就.Net而言,Lucene.Net项目似乎相当不活跃。这仍然是最好的选择吗?还是有其他可行的替代方案?

    11 回复  |  直到 15 年前
        1
  •  23
  •   maayank    15 年前

    虽然Lucene.Net在相当长的一段时间内没有“全面”的发布(即完整的文档、网站更新),但仍然有新的提交到它的SVN存储库。 see here ). 由于开发仍然是积极的,我会使用它的新的全文搜索项目。

        2
  •  11
  •   Dan Diplo    15 年前

    这不是开源的,但它是一个 而且非常 综合的 Microsoft提供的服务:

    Microsoft Search Server 2008 Express

    • 开箱即用的相关性。

      本地化接口。

      没有预设的文档限制。

      连续传播索引。

      内容摘要。

      点击突出显示。

      最佳匹配和定义。

      查询更正。

      重复折叠。

      按属性筛选。

      按语言过滤。

      按日期排序。

      电子邮件/RSS警报

        3
  •  6
  •   Steve Severance    15 年前

    由于lucene.net是一个端口,因此它必然滞后于java。我也不喜欢lucene端口是一个直接的副本,尽管我认为它确实使文档更容易使用。需要考虑的是使用 Solr 如果您不需要超紧密(二进制)集成。我以前用过,效果很好。它仍然由Lucene提供动力,但我认为它更好,因为它有一些更好的特性。您可以通过HTTP端点从.net使用它。

    要问自己的一个问题是,在搜索解决方案中,您真正需要/想要的是什么。实现搜索有很多方法,但并非所有的解决方案都适用于每种情况。

        4
  •  6
  •   Mark    14 年前

        5
  •  5
  •   Steffen Opel Norm Johanson    14 年前

    在几个项目中使用了Lucene.Net之后,我还想添加一个建议,即使用 IKVM.NET

        6
  •  4
  •   griti    15 年前

    我们目前开发了一个原型,配置Lucene只需几分钟(我们使用fluent nhibernate)。

        7
  •  3
  •   ADAM    15 年前

    虽然它不是.net,但我建议使用Solr作为它在lucene上构建的基础,并且由于它返回XML/HTTP和JSON,因此集成起来很简单

        8
  •  3
  •   realMarkusSchmidt    15 年前

    据我所知,您需要在现有数据库上“只”建立一个全文索引,SQL Server全文搜索原则上适合您,但您当前的实现/设置太慢。

    如果我是你,我不会选择完全不同的方法(只要想想如何让外部索引与数据库保持同步,或者将两者的查询结果连接起来等等)。尝试用SQL Server解决性能问题,因为没有人会认真地认为搜索7k行的6秒时间是用于全球一些最大数据库的企业级解决方案的最终决定。。。也许尝试问一个关于此功能常见缺陷的新问题(我不是这方面的专家),您可能会得到一个简单的修复,而不是完全重建搜索架构;)

        9
  •  2
  •   russau    15 年前

    www.searcharoo.net . 它有一个爬虫,并具有诸如工作词干、为办公室文档/PDF编制索引等功能。作者在codeproject文章中非常活跃,并且很快就回答了问题。

        10
  •  1
  •   Doug    13 年前

    此后,我开始使用SearchAroo: http://www.searcharoo.net/

    它使用XML数据存储,我发现它的性能与dot lucene非常相似。

        11
  •  0
  •   Birger    15 年前

    如果你不是真的坚持.Net,你可以试试斯芬克斯。开源,适用于所有平台(Windows/Linux)。