代码之家 › 专栏 › 技术社区 › âÊÊá¸á¸½á¸

如何在stringr中使用单词边界[[副本]

stringr regex r

âÊÊá¸á¸½á¸ · 技术社区 · 3 年前

> str_detect('the U.S. have been', regex('\\bu\\.s\\.',ignore_case = TRUE))
[1] TRUE
> str_detect('the U.S. have been', regex('\\bu\\.s\\.\\b',ignore_case = TRUE))
[1] FALSE

为什么在第二种情况下匹配失败?在“have”之前不是有一个词的边界吗?

谢谢!

2 回复 | 直到 3 年前

akrun 3 年前

我们可以用 \\s

 str_detect('the U.S. have been', regex('\\bu\\.s\\.\\s',ignore_case = TRUE))

Calum You 3 年前

尝试运行以下命令以查看问题:

str_view_all('the U.S. have been', regex('\\b', ignore_case = TRUE))

\b 匹配单词边界,即从单词字符(字母、标记和小数)到非单词字符的转换。这里,从 S . 是一个词的边界,因为 . . 到不是。所以你的第二个模式不匹配(没有 . 紧接着一个词的边界)

推荐文章

Marc B. · 使用ggplot2创建条形图时“缺少值”

1 年前

deschen · tidyverse与外部向量发生突变,该外部向量的元素是数据帧中的列值

1 年前

Laura · 在Shiny中使用可排序的包拖放名称,这些名称将成为图表

1 年前

Mallikarjun M · 如何使用随机森林进行时间序列预测?

1 年前

ly li · 模型摘要:当表格形状改变时,拟合优度消失

1 年前

C.Robin · 将marginaffects::predictions()的结果连接回main df?

1 年前

monotonic · 如何将格式为“col1+col3+col4”的数据帧的行名转换为一列数字向量“c(1,3,4)”?

2 年前

Shawn Hemelstrand · 为什么我的自定义errorbar函数不能在R中工作?

2 年前

RoyBatty · 统计每个字符在整个数据集中出现的次数

2 年前

stats_noob · R: 记录某个“行为”发生的循环的索引?

2 年前