如果你需要全部
td
然后使用
xpath('//td')
import lxml.html
html = '''
<tr>
<td>10</td>
<td>$681</td>
<td>Wednesday</td>
<td>other</td>
<td>data</td>
</tr>
'''
soup = lxml.html.fromstring(html)
all_td = soup.xpath('//td')
for td in all_td:
print(td.text)
后果
10
$681
Wednesday
other
data
如果你只需要
td公司
然后获取全部,然后使用索引ie
[2]
,或切片
[2:]
for td in all_td[2:]:
print(td.text)
后果
Wednesday
other
data
您只能使用
[3]
直接在xpath中
xpath('//td[3]')
import lxml.html
html = '''
<tr>
<td>10</td>
<td>$681</td>
<td>Wednesday</td>
</tr>
'''
soup = lxml.html.fromstring(html)
date = soup.xpath('//td[3]/text()')[0]
print(date)
后果
Wednesday