代码之家  ›  专栏  ›  技术社区  ›  Evert

如何使用“请求”模块在搜索栏中输入信息?

  •  -1
  • Evert  · 技术社区  · 2 年前

    我试图从这个网站上搜集数据: https://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi

    我有一个科学物种名称列表,我想在搜索栏中逐个输入,然后使用HTML解析器从页面中提取相关信息。我似乎不知道如何在搜索栏中输入字符串。这是否可以使用请求模块,还是应该使用其他模块?搜索栏的HTML行如下所示:

    <input id="searchtxt" type="text" name="name" value="" size"">
    

    如果我手动搜索网页,则该行如下所示:

    <input id="searchtxt" type="text" name="name" value="Hyperia galba" size"">
    

    奇怪的是,URL在搜索后没有改变。

    1 回复  |  直到 2 年前
        1
  •  0
  •   Flow    2 年前

    使用此url: https://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?name=

    您可以搜索内容,而无需将内容放入搜索栏

    例子:

    import requests
    
    q = "Phage E"
    url = f'https://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?name={q}'
    info = requests.get(url)
    print(info.text)