代码之家  ›  专栏  ›  技术社区  ›  Alex Klaus

根据嵌套结构/集合的属性筛选和排序的ravendb索引(fanout索引)

  •  1
  • Alex Klaus  · 技术社区  · 6 年前

    我正在寻找一种方法来创建 static index 为嵌套结构(对象集合)中的属性值组合以及结构容器提供筛选/排序查询。这似乎不是小事,原因如下:

    • 如果嵌套结构/集合的属性被分隔成索引的各个字段(单个集合),则无法使用 AND 对嵌套结构/集合的2+属性进行筛选时的条件。
    • 这个 fanout index 复杂性(参见 example ,这使得任何解决方案都运行得太慢。

    给定以下持久模型:

    public class Document
    {
        public string Title { get; set; }
    
        public List<UserChange> RecentModifications { get; set; }
    }
    

    哪里

    public class UserChange
    {
        public string UserId { get; set; }
        public DateTime Timestamp { get; set; }
    }
    

    问题: 如何为建立索引 Document 按所有字段的组合筛选/排序: Title , UserId Timestamp ?

    可能的用例:

    • 获取包含特定用户的“合同”和日期范围的所有文档
    • 按用户最后一次修改对包含“合同”一词的文档进行排序。

    P.S.我理解索引限制可以通过重新构造持久性模型来绕过—将最近修改的文档的结构存储在 User 文件,但它会施加一些其他限制,我想避免。

    2 回复  |  直到 6 年前
        1
  •  1
  •   Alex Klaus    6 年前

    这个问题可以通过使用 Indexes with Dynamic Fields . 它允许保持逻辑数据结构,并避免创建 fanout index .

    解决方案

    Document 从上面收集:

    public class MyIndex : AbstractIndexCreationTask<Document, DocumentIndDto>
    {
        public MyIndex()
        {
            // Add fields that are used for filtering and sorting
            Map = docs =>
                from e in docs
                select new
                {
                    Title = e.Title, 
                    _ = e.RecentModifications.Select( x => CreateField ($"{nameof(Document.RecentModifications)}_{x.UserId}", x.Timestamp))
                };
        }
    }
    
    public class DocumentIndDto
    {
        public string Title { get; set; }
        public Dictionary<string,DateTime> RecentModifications { get; set; }
    }
    

    查询 MyIndex 喜欢

    var q = s.Query<DocumentIndDto, MyIndex>()
                    .Where(p => p.Title == "Super" && p. RecentModifications["User1"] < DateTime.Now);
    

    解释

    具有动态字段的指定索引将以以下格式为每个记录生成额外字段和术语:

    RecentModifications_User1 = '2018-07-01';
    RecentModifications_User2 = '2018-07-02';
    

    格式很重要,因为在高级查询中使用字典时 myDic[key] ,它被转换为 myDic_key 在生成的rql中。因此,它将允许我们在查询中使用这些字段。

    如果您使用 Query 而不是 DocumentQuery (见 docs ),则需要正确的数据类型才能使linq工作。为此我创造了 DocumentIndDto 班级,我的 RecentModifications 已经成为一个字典,所以我可以在高级查询中使用它并得到正确的rql

    from index 'MyIndex' where Title = $p0 and RecentModifications_User1 = $p1
    

    有关详细信息,请参阅 discussion 关于奥伦·埃尼(又名阿延德·拉希恩)的主题。

        2
  •  0
  •   Danielle    6 年前

    在索引定义中使用以下RQL:

    from doc in docs.Documents
    from modification in doc.RecentModifications 
    select new {
        modification.UserId,
        modification.Timestamp
    }
    

    注释 :“userid”&“timestamp”未在基础索引项中分隔。

    因此,对userid='a'和timestamp='2018-01-01'组合进行过滤 威尔 用户“A”在“2018-01-01”修改的返回记录。

    也见 Fanout Indexes

    备注2 : “title”也可以通过以下方式进行索引和搜索:

    from doc in docs.Documents
    from modification in doc.RecentModifications 
    select new {
        doc.Title,
        modification.UserId,
        modification.Timestamp
    }
    

    因此每个生成的“索引项”将包含 “你好” 和; “时间戳” 和以前一样-和相关的 “标题”