代码之家  ›  专栏  ›  技术社区  ›  Adrian Ivasku

python 3 regex提取字符串的一部分[重复]

  •  -1
  • Adrian Ivasku  · 技术社区  · 6 年前

    我已经尝试了所有StackOverflow解决方案来解决类似的问题,但找不到任何解决方案。

    我有这段代码片段,我需要在HTML标记之间提取文本,以及>和<之间的所有内容。

    word = "div class="name">
                            Text_I_Want_To_Extract 
                        </div>"
    
    m = re.search('>(.+)<', word)
    print (m)
    

    我尝试过各种regex表达式,但失败了。我总是得到空的结果。我猜是因为我提取了>和<符号之间的所有内容。

    有人对python 3有这种问题吗?

    1 回复  |  直到 6 年前
        1
  •  0
  •   Rakesh    6 年前

    试用使用 flags

    前任:

    import re
    
    word = """div class="name">
                            Text_I_Want_To_Extract 
                        </div>"""
    
    m = re.search('>(.+)<', word, flags=re.DOTALL)
    print (m.group(1).strip())
    

    输出:

    Text_I_Want_To_Extract