代码之家  ›  专栏  ›  技术社区  ›  thichxai

如何排除MarkLogic中的一些原始PDF

  •  1
  • thichxai  · 技术社区  · 6 年前

    我收集了一千多份未加工的PDF。如何排除一些不需要的原始PDF。我有一个代码,但不知道如何排除e001.pdf和e002.pdf。事先谢谢。

    收藏/电子版PDF

    我试图排除集合中的两个pdf(e001.pdf,e002.pdf)

    xquery version "1.0-ml";
    
    let $pdf-uris := cts:uris(
                 (),(),
                         cts:and-query((
                           cts:collection-query("/electric-pdf"),
                           cts:not-query(what's cts function should I use exclude e001.pdf, e002.pdf in collection )
                         ))  
    
                 )
    return $pdf-uris
    
    1 回复  |  直到 6 年前
        1
  •  6
  •   Mads Hansen    6 年前

    使用 cts:document-query ,它接受一个URI序列。例如:

    cts:not-query(cts:document-query(('1e001.pdf', e002.pdf'))