1
2
如果html页面格式不正确,没有很多解决方案可以真正帮助您。BeautifulSoup或其他解析库是解析html文件的方法。 regular-expression-to-extract-url-from-an-html-link 使用范围[a-Z] |
2
1
当我需要解析一个真正损坏的html时,速度不是最重要的因素 selenium & webdriver . 支票 this tutorial 它展示了如何使用webdriver提取google建议(代码是java语言,但可以更改为python)。 |
3
0
我最终得到了regex和BeautifulSoup的组合:
到目前为止,这对我的用例是有效的,但我不能保证它在所有页面上都有效。另外,我只在原始函数失败时使用这个函数。 |
Softly · 单选按钮未按预期取值 1 年前 |
NovoMannen · 导航中的下拉菜单在内容后面重叠 1 年前 |
eXor420 · 如何在脚本标记中使用导出的函数? 1 年前 |
IonicMan · 剑道网格在宽度过大时不显示某些列 1 年前 |
Kernier · 如何将数学公式支持添加到StacksEditor? 1 年前 |
Md. Ibrahim · CSS网格项溢出小屏幕滚动 1 年前 |
Akshay mek · Vscode扩展建议不适用于某些文件夹 1 年前 |