代码之家 › 专栏 › 技术社区 › Keith John Hutchison

我正在寻找一种使用python正则表达式从文本中提取作业编号的方法

regex python

Keith John Hutchison · 技术社区 · 6 年前

作业45、作业32、作业15或作业45、作业32、作业15

re.findall(r'[job]\d+', 'Job 45, job 32 and then job 15'.lower())
[]

我试着在工作中分开。

re.split(r'job','Job 45, job 32 and then job 15'.lower())
['', ' 45, ', ' 32 and then ', ' 15']

我试着在文字上分裂。

re.findall(r'\w+','Job 45, job 32 and then job 15'.lower())
['job', '45', 'job', '32', 'and', 'then', 'job', '15']

3 回复 | 直到 6 年前

Pushpesh Kumar Rajwanshi 6 年前

你的正则表达式 [job]\d+ 有两个问题,

[job]

第二个问题,在正则表达式中没有在job和number之间提供空格。

第三个问题,因为输入文本包含Job和Job,所以要进行不区分大小写的匹配,需要(?i)标志。

所以你的正则表达式的正确形式变成了,

(?i)job\s+\d+

python示例代码

import re
s = 'Job 45, job 32 and then job 15';
str = re.findall('(?i)job\s+\d+', s)
print(str)

['Job 45', 'job 32', 'job 15']

U13-Forward 6 年前

或者更容易使用 'job (\d+)'

>>> re.findall('job (\d+)',s.lower())
['45', '32', '15']
>>>

Tim Biegeleisen 6 年前

一种方法是使用以下模式,该模式使用正向查找:

(?<=\bjob )\d+

这将捕获紧跟在文本前面的任何一组数字 job (不区分大小写)后跟一个空格。

text = "Job 45, job 32 and then job 15"
res = re.findall(r'(?<=\bjob )\d+', text, re.I)
print(res)

['45', '32', '15']

推荐文章

July · 如何定义数字间隔,然后四舍五入

1 年前

Community wiki · 对象名称前的单下划线和双下划线的含义是什么?

1 年前

Brian Johnson · 为什么在Python中列出字典列表会引发TypeError?[已关闭]

1 年前

user026 · 如何根据特定窗口的平均值(行数)创建新列?

1 年前

Ashok Shrestha · 需要追踪特定的颜色线并获取坐标

1 年前

Nicote Ool · 在FastApi和Vue3中获得422

1 年前

NeoExceptCodeBad · 如果我有很多垂直线,我如何找到它们的边缘?

1 年前

Abdulaziz · 如何对集合内的列表进行排序[重复]

1 年前

user2743931 · 带有src目录的Python setup.py

1 年前

asmgx · 为什么合并数据帧不能按照python中的预期方式工作

1 年前