代码之家 › 专栏 › 技术社区 › Tim Lytle

匹配除子模式以外的任何内容

parsing regex php

Tim Lytle · 技术社区 · 15 年前

我想完成这个(我相信是无效的)正则表达式要做的工作:

<p><a>([^(<\/a>)]+?)<\/a></p>uniquestring

基本上匹配除结束锚标记以外的任何内容。简单的非贪婪在这里没有帮助,因为“uniquestring”很可能是在另一个遥远的结束锚标记之后:

<p><a>text I don't <tag>want</tag> to match</a></p>random 
data<p><a>text I do <tag>want to</tag> match</a></p>uniquestring more
matches <p><a>of <tag>text I do</tag> want to match</a></p>uniquestring

所以在锚定标记之间有更多的标记。我在利用 uniquestring 以确定是否要匹配数据。所以一个简单的非贪婪的结果是匹配所有的东西,从我不想要的数据开始到我想要的数据结束。

我知道我正在接近正则表达式(或者至少我对它们的了解)不擅长解决的问题。我可以在HTML/XML解析器中浏览数据,但这只是一个简单的(ish)搜索。

有什么简单的方法可以做到这一点吗?

1 回复 | 直到 15 年前

ZyX 15 年前

您正在寻找零宽度的负向后视:

<p><a>((?<!<\/a>).)+<\/a><\/p>uniquestring

测试:

(zyx:~) % echo $T
<p><a>text I don't <tag>want</tag> to match</a></p>random  data<p><a>text I do <tag>want to</tag> match</a></p>uniquestring more matches <p><a>of <tag>text I do</tag> want to match</a></p>uniquestring
(zyx:~) % echo $T | grep -oP '<p><a>((?<!<\/a>).)+<\/a><\/p>uniquestring'
<p><a>text I do <tag>want to</tag> match</a></p>uniquestring
<p><a>of <tag>text I do</tag> want to match</a></p>uniquestring

推荐文章

DotFX · RegEx捕获关键字前但括号后的所有内容

4 月前

user66001 · 正则表达式用于匹配有引号和无引号的文本,并且不匹配任何部分

5 月前

perlchamp · 为什么这也匹配?

5 月前

con · Negative Lookaward在perl正则表达式中不起作用

5 月前

Andrus · 如何在sql中查找第二个匹配项

5 月前

iato · 确保正则表达式不从命名材料中的数字中提取

5 月前

vr8ce · 非成对标记中特定字符的正则表达式

5 月前

MARTIN · 交换第一个和最后一个单词,反转所有中间的字符

6 月前

Carsten · 使用最近的搜索模式更改文本块

6 月前

Eric Marceau · Grep:有没有一种特殊的方法可以将“无字符”作为“字符位置”匹配的置换?

6 月前