代码之家 › 专栏 › 技术社区 › Ram Rachum

让BeautifulSoup以不区分大小写的方式捕获标记

case-insensitive beautifulsoup parsing html python

2

Ram Rachum · 技术社区 · 14 年前

<p> 标签 <title> 标签,一些 <meta> <META> 我想抓住这个机会。

2 回复 | 直到 14 年前

1

0

Mark Byers 14 年前

你可以用 soup.findAll

import BeautifulSoup

html = '''<html>
<head>
<meta name="description" content="Free Web tutorials on HTML, CSS, XML" /> 
<META name="keywords" content="HTML, CSS, XML" /> 
<title>Test</title>
</head>
<body>
</body>
</html>'''

soup = BeautifulSoup.BeautifulSoup(html)
for x in soup.findAll('meta'):
    print x

结果:

<meta name="description" content="Free Web tutorials on HTML, CSS, XML" />
<meta name="keywords" content="HTML, CSS, XML" />

2

Oli 14 年前

BeautifulSoup标准化了输入的解析树。它将标记转换为小写。你没什么好担心的。

推荐文章

nojohnny101 · 按变量筛选列表的唯一LINQ(不区分大小写)

7 年前

MagicToaster · 如何对具有给定后缀的文件执行不区分大小写的搜索?

7 年前

user8450148 · PSQL不区分大小写的索引lower()不起作用

7 年前

Tigerware · 瓦丁:如何使所有片段URL不区分大小写

7 年前

Charles Okwuagwu · 如何在Erlang/Elixir中执行不区分大小写的文件搜索

7 年前

Azi Chen · Ransack-gem-不区分大小写搜索

10 年前

Vigorou · 如何使此代码不区分大小写?

11 年前