代码之家  ›  专栏  ›  技术社区  ›  Pablo Santa Cruz

全文搜索示例数据库

  •  3
  • Pablo Santa Cruz  · 技术社区  · 14 年前

    我希望在PostgreSQL、SQLServer和Lucene中对全文搜索索引进行一些基准测试。

    关于在哪里找到一个好的大样本数据库来执行查询有什么想法吗?

    提前多谢。

    1 回复  |  直到 13 年前
        1
  •  2
  •   Cjxcz Odjcayrwl    13 年前

    我认为最好的来源是维基百科的数据库转储,因为它们包含大量的文本。它们在这里提供: http://dumps.wikimedia.org/

    您也可以尝试使用usenet存档,但是很难选择目标语言,而且使用的语言质量也较低。

    推荐文章