代码之家  ›  专栏  ›  技术社区  ›  mHelpMe

从网页中删除表格数据

  •  0
  • mHelpMe  · 技术社区  · 4 年前

    我正努力学习蟒蛇和葡萄牙语,以为我可以一石二鸟。

    下面是一个 pages

    下面是我的代码,但我正在挣扎。我的results变量确实包含了我需要的数据,但是由于div标记没有id,所以我无法提取确切的位。

    有更好的办法吗?

     import requests
     from bs4 import BeautifulSoup
    
     URL = 'https://conjugator.reverso.net/conjugation-portuguese-verb-ser.html'
     page = requests.get(URL)
     soup = BeautifulSoup(page.content, 'html.parser')
     results = soup.find(id='ch_divSimple')
     mychk = results.prettify()
     tbl_elems = results.find_all('section', class_='wrap-verbs-listing')
    
    0 回复  |  直到 4 年前
        1
  •  1
  •   XavierBrt    4 年前

    他们没有身份证,但他们有课。你可以:

    results.find_all("div", "blue-box-wrap")
    

    在哪里? blue-box-wrap

    它将返回 ResultSet

    blue_tables = results.find_all("div", "blue-box-wrap")
    blue_tables[0]
    
        2
  •  1
  •   Shubham Sharma mkln    4 年前

    替换:

     results = soup.find(id='ch_divSimple')
     mychk = results.prettify()
     tbl_elems = results.find_all('section', class_='wrap-verbs-listing')
    

    results = soup.find("div", attrs={"class": 'blue-box-wrap'})
    tbl_elems = results.find_all('ul', class_='wrap-verbs-listing')