1
9
你真的需要 HTML parser 为此 |
2
6
不要使用regex解析HTML。考虑使用 HTML Agility Pack . |
3
2
有一些可能性: 正则表达式 -快速但不可靠,它不能处理格式错误的HTML。 HTMG -很好,但是有很多内存泄漏。如果你想处理一些文件,没有问题。 SGMLRead -很好,但有个问题。有时它找不到默认的名称空间来获取其他节点,那么就不可能解析HTML。 http://developer.mindtouch.com/SgmlReader 雄伟-12 -很好,但不如sgmlreader快。 http://www.majestic12.co.uk/projects/html_parser.php sgmlreader(vb.net)示例
在Majestic-12中,不同的是,您必须使用“Next”命令步行到每个标签。您可以使用DLL找到一个示例代码。 |
4
1
正如其他人提到的,使用htmlagilityPack。但是,如果您喜欢jquery/css选择器,我刚刚找到了一个名为fizzler的htmlagilityPack的分支:
http://code.google.com/p/fizzler/
用这个你可以找到所有
或者找到一个特定的类
再简单不过了! |