代码之家 › 专栏 › 技术社区 › Marc Seeger

不带计数的不同SOLR字段值

facet solr

Marc Seeger · 技术社区 · 14 年前

我的问题和 this question
不同的是,我需要最少的内存密集型方法来收集关于不同值的信息。在这种情况下,我不关心实际计数,我只想知道该字段的可能值。
我总是耗尽堆空间(3000多万个文档),必须有某种方法/参数来节省内存

3 回复 | 直到 7 年前

Pascal Dimassimo 14 年前

如果不同值的数目很高,则可能需要执行方面分页。使用facet.offset和facet.limit参数。

Community pid 7 年前

使用statcomponenet检索特定字段的不同值列表: https://cwiki.apache.org/confluence/display/solr/The+Stats+Component

参数 stats.calcdistinct :

如果为true,则将计算非重复值,并在响应中返回“countDistinct”和“distinctValues”。对于某些字段,此计算可能很昂贵,因此默认情况下为false。如果只想返回特定字段的不同值,还可以指定f..stats.calcdistinct,替换为字段名,以将不同值计算限制为所需字段。

为了降低负载,尽可能少地检索它并缓存结果,只有在数据发生更改时才重新检索。

如果您的索引通常很慢,您可能需要查看缓存配置和/或给SOLR更多的RAM(如果您有办法的话)。

最初在这里(由我)回答:

https://stackoverflow.com/a/26714447/621690

Jem 14 年前

我不知道内存使用情况,但你可能想试试 Field collapsing 你会找到Solr的补丁 here .

推荐文章

Denver Dang · 平面图上的单个文本重叠

7 年前

astrsk · R: 在ggplot2条形图中为每个方面绘制唯一的因子集

7 年前

John Gagnon · 如何在gglpot2中定义y轴段

7 年前

user8491385 · facet\u wrap添加geom\u hline

7 年前

Mariel · ggplot2:面标签模糊

7 年前

ulima2_ · 仅在一个方面内使用ggplot的注释

7 年前

MZZ · 如何为R上的每个方面(条形图)注释不同的值?

7 年前

J.Con · 在facet\u wrap strip text中仅显示一个变量标签?

7 年前

user2568648 · ggplot2分类x轴的不同刻面宽度[重复]

7 年前

IronMan323 · 弹性5.5中的镶嵌面

7 年前