![]() |
1
5
如果要用一次搜索搜索所有类型的文档,最好保留所有 键入一个索引。在索引中,可以定义更多要标记或矢量化的字段类型。 如果要单独搜索术语,最好将每种类型索引为一个索引。 另一方面,我们可以用多个指数来平衡我们的负荷。 |
![]() |
2
2
我将使用一个索引,为类型添加一个关键字(indexed,stored)字段,如果需要,它将允许您进行筛选,并告诉您返回的结果之间的差异。 (也许在你的问题中。。。使用单独的索引可以让每个语料库都有自己的相关度得分,不知道一个语料库中重复的词语是否会使其他语料库中的文档失去相关性?) |
![]() |
3
1
您应该从逻辑上考虑每个数据集包含什么,并根据主题或其他标准(如地理位置、业务单元等)设计索引。一般来说,索引体系结构与数据库相似(例如,即使技术上可行,也可能不会将会计与人事数据库结合起来)。 正如@llama指出的,创建一个单一的uber索引会影响相关性得分、安全/访问问题等,并引发一系列新的麻烦。 总而言之:根据您的业务需要考虑逻辑分区结构。如果没有进一步的背景很难解释。 |
![]() |
vishnu · 内存索引和lucene文件索引有什么区别? 6 年前 |
![]() |
Fabio B. · 如何在Solr中排序/增强产品搜索结果 6 年前 |
![]() |
Alex Torrisi · 文档中短语查询匹配数 6 年前 |
|
NoName2 · 平均结果的弹性Luence查询 7 年前 |
![]() |
hayfreed · Lucene API查询始终返回第一个字典结果 7 年前 |