代码之家 › 专栏 › 技术社区 › Adrian Ivasku

python 3 regex提取字符串的一部分[重复]

python-3.x regex python

-1

Adrian Ivasku · 技术社区 · 6 年前

这个问题已经有了答案:

我已经尝试了所有StackOverflow解决方案来解决类似的问题,但找不到任何解决方案。

我有这段代码片段,我需要在HTML标记之间提取文本,以及>和<之间的所有内容。

word = "div class="name">
                        Text_I_Want_To_Extract 
                    </div>"

m = re.search('>(.+)<', word)
print (m)

我尝试过各种regex表达式,但失败了。我总是得到空的结果。我猜是因为我提取了>和<符号之间的所有内容。

有人对python 3有这种问题吗?

1 回复 | 直到 6 年前

Rakesh 6 年前

试用使用 flags

前任:

import re

word = """div class="name">
                        Text_I_Want_To_Extract 
                    </div>"""

m = re.search('>(.+)<', word, flags=re.DOTALL)
print (m.group(1).strip())

输出:

Text_I_Want_To_Extract

推荐文章

lonix · 使用sed从JSON中提取非贪婪正则表达式

1 年前

me-me · regex检查电子邮件字符串是否有@后跟一个点以及点符号后至少2个字符[重复]

2 年前

Dave Guerrero · 是否有一个正则表达式模式来捕获字符串中直到第一个字母字符的数字?

2 年前

Dima Malko · 如何在指定符号前添加符号?

2 年前

shekharsabale · 从列表元素捕获子字符串

2 年前

maycca · 正则表达式:过滤年份数值大于某个值的文件?字符串中编码的年份

2 年前

Katia · 根据特定规则进行多行匹配

2 年前

Andrei Cleland · 在长正则表达式中包含unicode字符

2 年前

MHA · Pandas str.extract()以字母结尾的数字

2 年前

Slava Vir · 如何查找后面“/”之间的最后一组

2 年前