代码之家 › 专栏 › 技术社区 › nestlejscrunch

如何使用python遍历xml路径字符串(表行-tr[1]、tr[2]、tr[3]…)?

web-scraping selenium xml html python

-1

nestlejscrunch · 技术社区 · 6 年前

我有这个html xml路径:

"//*[@id="example"]/tbody/tr[2]/td[1]"

它必须通过find_element()算法作为字符串处理但是我需要在tr[2]处迭代(例如,tr[2]、tr[3]、tr[4]…),这样我的WebScraping算法就可以在HTML表中展开一个可点击的按钮。

有哪些策略/实现可以实现这一点?

(我使用selenium python库作为webscraper)

2 回复 | 直到 6 年前

Raj 6 年前

可以使用以下代码获取所有所需元素(行)的集合:

driver.find_elements_by_xpath("//*[@id="example"]/tbody//tr/td[1]");

然后可以遍历元素集合并执行所需的操作。

cruisepandey 6 年前

如果你想绕过去,

让xpath像这样动态:

我想你有5排。

for i in range(5):
 driver.find_element_by_xpath("//*[@id="example"]/tbody/tr['"+i+"']/td[1]").click()

或者使用webdriverwait,它将是:

wait = WebDriverWait(driver,30)

for i in range(5): 
  wait.until(EC.element_to_be_clickable((By.XPATH, "//*[@id="example"]/tbody/tr['"+i+"']/td[1]"))).click()

请注意,如果您需要导入这些:

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

推荐文章

JobProcessTask · 如何读取此xpath表达式?

2 年前

Sven K · 无法访问XML数据结构中的“数据”:“名称属性>数据”

2 年前

sklal · 在Python中从S3存储桶读取xml文件——只存储最后一个文件的内容

2 年前

MBF · PHP导入/解析XML文件内容保存到数据库

2 年前

TenkMan · SQL Server XML嵌套值查询表单990

2 年前

lam62 · 如何使用XML从XHTML/XML中提取相关数据。dom。小型化

2 年前

Mohan.Murali.Peddini · XSLT模板循环记录

2 年前

mayo0o · 检查元素的总和

2 年前

crichavin · 排除XSLT的(1.0)行返回和文本输出中的额外空白

2 年前

Crimp · 从Excel导出后,在XML文件和PowerShell输出中发现奇怪字符:

2 年前