代码之家  ›  专栏  ›  技术社区  ›  tekamed

lucene索引损坏的原因[Alfresco 4.2]

  •  1
  • tekamed  · 技术社区  · 7 年前

    我正在REDHAT 7服务器上运行alfresco 4.2。所以我必须处理Lucene 2.4。 我要处理的问题是Lucene索引越来越频繁地被破坏。每次发生这种情况,回购都会发生。并且完全重新索引,使服务器再次启动。

    我需要帮助来了解导致索引损坏的原因。以及如何处理(重新索引需要很多时间)

    2 回复  |  直到 7 年前
        1
  •  0
  •   rotarydial    7 年前

    在我认真开始之前,让我先提一下:户外用具 Solr which uses Lucene 对于索引,因此我不会直接在Alfresco上管理Lucene索引。相反,可以通过Alfresco提供的Solr工具来管理索引。

    一、 也发现Lucene/Solr指数在这个版本的Alfresco(4.2.0)中倾向于“漂移”。在这方面,我们多次寻求露天支持,但没有找到可靠的根本原因;他们这么说 也许 归因于我们所做的“某些定制”,但它们并没有比这更具体。

    因此,虽然我们还没有找到解决方案,但我们采取了一些积极主动的措施来缓解这个问题。

    1. 我们每天都会查看Solr报告( https://your-alfresco-server.com:8443/solr/report/ ). 在这份报告中,有一个值标记为“指数中的交易计数,但不是DB”(根据我的经验,这是一个非常误导人的标签)。该值越高,我们的索引似乎越不同步,因此随着它的攀升,我们将安排在无人会受到影响的时间重新索引。

    2. Alfresco服务器向修复和重新索引Solr公开了一些服务。(完全披露:我没有发现它们非常有效,但它们是由Alfresco Support推荐的)。

    Solr重新索引服务: http://your-alfresco-server.com:8080/solr/admin/cores?action=REINDEX&txid=

    Solr“修复”服务: http://your-alfresco-server.com:8080/solr/admin/cores?action=FIX

    1. 清除过时内容可以减少重新编制索引的时间(这包括Alfresco生成的传输报告等,这些报告往往会累积,但至少在我的情况下并不重要)。

    不幸的是,真正的解决方案往往归结为按计划、轮流重新编制索引,以最大限度地减少停机时间。

        2
  •  0
  •   Katz    7 年前

    我们也在使用Lucene,尽管它不适用于Alfresco。 从我们所看到的情况来看,Lucene为每个文档提供的唯一ID存在一个问题,在向索引中添加或删除文档时,实际上有时会发生更改。。。 我们还没能走得更远,但也许这可以帮助你走上正轨。