![]() |
2
2
我推荐 Html Agility Pack . 它能够处理结构不良的HTML,同时使用Xpath提供类似Xml的选择。您仍然需要为项目设置模板或使用不同的选择进行选择和分析,但这将帮助您克服糟糕的结构驼峰。 |
![]() |
3
2
如上所述 here 在之前的其他问题上, Beautiful Soup 可以解析奇怪的HTML。
|
![]() |
5
0
这上面有几个C#特定的线程,比如 Looking for C# HTML parser . |
![]() |
6
0
我也有一个类似的问题,但在我的例子中,我只想从页面中获取一段特定的数据,这段数据很容易识别,而无需解析HTML,因此正则表达式工作得非常好。 |