代码之家  ›  专栏  ›  技术社区  ›  Begtostudy

如何从网页下载文件?

  •  0
  • Begtostudy  · 技术社区  · 14 年前

    如何通过python或ironpython从url/页面获取超链接。

    我该怎么做?

    我不是以英语为母语的人,所以对不起我的英语。

    2 回复  |  直到 14 年前
        1
  •  2
  •   Brian Lyttle    14 年前

    你应该能够使用 BeautifulSoup library 使用CPython(普通Python)和IronPython。查看 findAll() 方法。这将拉出所有链接的列表。

    soup.findAll('a')
    
        2
  •  1
  •   bluesmoon    14 年前

    最简单的方法是将HTML页面传递到XML/HTML解析器中,然后调用 getElementsByTagName("A") 在根节点上。一旦你得到了它,遍历列表并拉出 href