![]() |
1
2
我99%确信get-html-source使用浏览器的innerhtml属性。innerHTML返回浏览器对文档的内部表示,并且在平台之间总是不一致和“不稳定”。 您可以通过将以下onload属性临时添加到页面的body标记来测试这一点。
这将在页面底部添加一个文本区域和文档的innerHTML。如果你看到同样“不正确”的html源代码,你就知道ie是罪魁祸首。 如果需要有效的标记,可能的解决方法是通过html tidy或其他清理程序运行源代码。我不知道有什么能让你在浏览器之间得到一致的渲染。 |
![]() |
2
1
谢谢艾伦。结果发现这是不同浏览器实现innerHTML的问题。 对于与列表有关的标记,例如 像safari和firefox这样的浏览器使用它们各自的innerHTML方法获取结束标记,但是internet explorer的innerHTML方法忽略了它们。 因为列表是结构化的,例如
html源字符串上的regex替换应该能做到这一点。 |
![]() |
ARH · 如何使用Selenium识别网站中使用的所有标签 2 年前 |
![]() |
vidhu · 无URL的自动化测试 2 年前 |
![]() |
Myoung Nam · 如何从谷歌搜索中提取多个div类? 2 年前 |