![]() |
1
0
简短的回答-这要看情况。在Selenium案例中,您看到的是HTML,在从浏览器进行处理后的表单。它们的主要目的(除了可视化内容,对我们来说,仅仅是人类:)是解析html、css和js,并将后两者应用于前者。从而得到一个结果,这是与他们的(js和css)规则集应用和有效(例如,小字母,在您的例子)。 lxml或任何其他xml解析库都不会这样做-它们解析xml/html 孤立地 ,他们不知道(或不关心)修改css之类的系统(他们关心xslt,但这是一个非常不同的主题)。因此,你看到的结果是HTML,因为它是写在它的“香草”形式,任何CSS规则,它引用不适用。
我的意思是“它取决于”,因为你可以在浏览器中加载HTML(或者任何其他解析器)。您可以在
它将HTML保存在浏览器的“inspect element”视图中所看到的相同表单中,可以使用任何JS和CSS结构(和内容)操作。但是,我不认为 正是这个案子 -将应用文本的小写字母;我认为它处于呈现阶段-例如,该值在源代码中为“原样”,但浏览器以不同的方式显示它。很遗憾我没有在电脑前亲自尝试。
我建议你的另一个方法是试试这个库-
requests-html
. 它是
|
![]() |
ARH · 如何使用Selenium识别网站中使用的所有标签 2 年前 |
![]() |
vidhu · 无URL的自动化测试 2 年前 |
![]() |
Myoung Nam · 如何从谷歌搜索中提取多个div类? 2 年前 |