1
1
使用A DOM 解析器查找包含指针且没有名为“a”的父元素的所有文本节点:
代码:
输出:
请注意,这也将替换a中范围内的Word。如果您也要排除这些内容,则必须将xpath调整为:
查找包含不嵌套在元素内任何位置的指针的所有文本节点。 有许多第三方解析器值得一提,目的是增强 DOM : phpQuery , Zend_Dom , QueryPath 和 FluentDom . |
2
2
我认为只使用正则表达式是可能的,但是很麻烦。所以这里有一个程序化的方法,那就是,无论如何,肮脏。
我会首先取代一切
毕竟,我会取代
|
3
2
类似这样的方法可以做到这一点,但是我建议您不要在这个任务中使用正则表达式。可能您可以使用dom并检查单词是否在允许的标记中,然后替换它。 |
lonix · 使用sed从JSON中提取非贪婪正则表达式 1 年前 |
Dima Malko · 如何在指定符号前添加符号? 2 年前 |
shekharsabale · 从列表元素捕获子字符串 2 年前 |
Katia · 根据特定规则进行多行匹配 2 年前 |
MHA · Pandas str.extract()以字母结尾的数字 2 年前 |
Slava Vir · 如何查找后面“/”之间的最后一组 2 年前 |