代码之家  ›  专栏  ›  技术社区  ›  Danyx

如何从维基百科API获取标题和摘要列表?

  •  2
  • Danyx  · 技术社区  · 8 年前

    我一直在试图得到一个可能的结果列表(与在维基百科中搜索时得到的结果相同)和一篇文章的小结,通常是第一段。

    到目前为止,我所能得到的只是标题列表:

    https://en.wikipedia.org/w/api.php?action=query&origin=*&list=search&srprop&srsearch=Albert%20Einstein&prop=extracts

    或单个页面的摘要:

    https://en.wikipedia.org/w/api.php?action=query&prop=extracts&exintro=&explaintext=&titles=Albert%20Einstein

    是否可以将这两个查询以类似的形式组合起来

    https://en.wikipedia.org/w/api.php?action=query&原点=*&列表=搜索&srprop&srsearch=Albert%20Einstein&prop=提取物

    或者我必须迭代第一个查询的所有结果,然后获取每个结果的摘要?

    1 回复  |  直到 8 年前
        1
  •  2
  •   Termininja Hassan Rahman    8 年前

    可以使用组合两个或多个查询的结果 generator parameter 因此,我们的想法是: generate 名单 search 结果(第一次查询),包括 extracts 每个结果的属性(第二个查询):

    action=query&generator=search&prop=extracts
    

    gsrsearch=Albert%20Einstein&gsrlimit=20
    

    以及所有查询属性的参数(在我们的示例中仅用于提取):

    exintro=1&explaintext=1&exchars=250&exlimit=20
    

    最终查询将是:

    https://en.wikipedia.org/w/api.php?action=query&origin=*&generator=search&prop=extracts&gsrsearch=Albert%20Einstein&gsrlimit=20&exintro=1&explaintext=1&exchars=350&exlimit=20