代码之家  ›  专栏  ›  技术社区  ›  Ram Rachum

让BeautifulSoup以不区分大小写的方式捕获标记

  •  2
  • Ram Rachum  · 技术社区  · 14 年前

    <p> 标签 <title> 标签,一些 <meta> <META> 我想抓住这个机会。

    2 回复  |  直到 14 年前
        1
  •  0
  •   Mark Byers    14 年前

    你可以用 soup.findAll

    import BeautifulSoup
    
    html = '''<html>
    <head>
    <meta name="description" content="Free Web tutorials on HTML, CSS, XML" /> 
    <META name="keywords" content="HTML, CSS, XML" /> 
    <title>Test</title>
    </head>
    <body>
    </body>
    </html>'''
    
    soup = BeautifulSoup.BeautifulSoup(html)
    for x in soup.findAll('meta'):
        print x
    

    结果:

    <meta name="description" content="Free Web tutorials on HTML, CSS, XML" />
    <meta name="keywords" content="HTML, CSS, XML" />
    
        2
  •  2
  •   Oli    14 年前

    BeautifulSoup标准化了输入的解析树。它将标记转换为小写。你没什么好担心的。