代码之家  ›  专栏  ›  技术社区  ›  Alkis Kalogeris

维基百科API信息框

  •  2
  • Alkis Kalogeris  · 技术社区  · 8 年前

    我正在使用维基百科API从某些页面获取信息框。 例如 Imperial College London 我的问题是 HESA student population|INSTID=0132 我得到的价值。我本希望只得到学生人数的数字,但我却得到了上面的id。如何获取页面中信息框的值?

    此外,如果您检查 wiki page 有两个信息框(主要和排名)。我怎样才能得到这两个?

    1 回复  |  直到 8 年前
        1
  •  2
  •   Petr    8 年前

    还有一个选择 REST API 您可以使用访问维基百科内容。要获得一篇文章的结构良好的HTML,您需要:

    https://en.wikipedia.org/api/rest_v1/page/html/Imperial_College_London

    HTML由 Parsoid 根据 DOM Spec 。收件箱将为html table 元素,这样您就可以轻松地找到页面上的所有收件箱。

    收件箱通常由复杂的模板创建,因此您可能更容易解析表格HTML。