![]() |
1
34
不幸的是,BeautifulSoup将其视为一个包含空格的类
这项工作:
|
![]() |
2
19
而且,你不必再输入findAll了。 |
![]() |
3
11
lxml . 它使用多个由空格分隔的类值(“class1 class2”)。 尽管名称不同,lxml还是用于解析和抓取HTML。它比BeautifulSoup快得多,甚至比BeautifulSoup(他们的名声)更好地处理“坏的”HTML。如果您不想学习lxml API,它也为BeautifulSoup提供了一个兼容API。 Ian Bicking agrees 更喜欢lxml而不是BeautifulSoup。 没有理由再使用BeautifulSoup了,除非你使用的是Google App Engine或者其他不允许使用Python的东西。
|
![]() |
4
2
比如:
|
![]() |
Alok Mishra · 如何自动点击“内容”按钮 7 年前 |
|
Ike · Python Selenium错误-当webdriver 7 年前 |
![]() |
ilyas · 使用网站查询获取数据[已关闭] 7 年前 |
![]() |
tanee · 通过rvest获取web抓取中的电子邮件地址 7 年前 |