1
8
解决“修复”损坏的HTML的方法是 HTMLPurifier (引用) :
如果要从文件加载HTML,请参见
|
2
4
对于修复损坏的HTML,可以使用 Tidy . 作为替代方案,您可以使用本机 XML Reader . 因为它是一个光标,在文档流中向前移动并在途中在每个节点处停止,所以它不会在无效的XML文档上中断。 见 http://www.ibm.com/developerworks/library/x-pullparsingphp.html |
3
1
您仍然使用PHP4XMLAPI有什么特别的原因吗? 如果您可以摆脱使用PHP5的XML API,有两种可能。 首先,尝试使用内置的HTML解析器。这真的不是很好(在格式不好的HTML上很容易窒息),但它可能会起作用。请看一下domDocument::loadHTML。 第二个选项-您可以尝试基于HTML5解析器规范的HTML解析器: http://code.google.com/p/html5lib/ 这往往比内置的php-html解析器工作得更好。它将HTML加载到domDocument对象中。 |
4
0
解决方案是使用domdocument。 例子:
优点:本机包含在PHP中,与PHP整洁相反。 |
Jacco · 未能格式化我的日期以在php中正确工作 1 年前 |
jay ram · 如何在URL核心php中从API获取JSON? 1 年前 |
Ishwarya A · php电子表格在浏览器中显示多张excel 1 年前 |