代码之家 › 专栏 › 技术社区 › bandcar

R:只保留值与另一列中的值不同的行

data-manipulation r

bandcar · 技术社区 · 2 年前

我只想保留第1列中最后两个字母(州名缩写)与第3列中最后两个字母不同的行

  countyname            fipscounty   neighborname            fipsneighbor
1 Archuleta County, CO  8007         Rio Grande County, CO   8105
2 Archuleta County, CO  8007         Rio Arriba County, NM   35039
3 Archuleta County, CO  8007         San Juan County, NM     35045

在第一排,两个县都在科罗拉多州。在第2行和第3行中,第一个县位于CO,第二个县位于NM。我只想保留第2行和第3行,使其看起来像这样:

  countyname            fipscounty   neighborname            fipsneighbor
2 Archuleta County, CO  8007         Rio Arriba County, NM   35039
3 Archuleta County, CO  8007         San Juan County, NM     35045

我该怎么做?

1 回复 | 直到 2 年前

AndrewGB 2 年前

我们可以使用 str_sub ,并仅返回州缩写不匹配的行。

library(tidyverse)

df %>% 
  filter(str_sub(countyname, start= -2) != (str_sub(neighborname, start= -2)))

输出

            countyname fipscounty          neighborname fipsneighbor
1 Archuleta County, CO       8007 Rio Arriba County, NM        35039
2 Archuleta County, CO       8007   San Juan County, NM        35045

或者在base R中,我们可以使用 sub ,然后过滤数据帧。

df[sub('.*(?=.{2}$)', '', df$countyname, perl=T) !=
     sub('.*(?=.{2}$)', '', df$neighborname, perl=T),]

或者使用 substr (尽管要详细得多):

df[substr(df$countyname, nchar(df$countyname)-1, nchar(df$countyname)) !=
substr(df$neighborname, nchar(df$neighborname)-1, nchar(df$neighborname)),]

数据

df <- structure(list(countyname = c("Archuleta County, CO", "Archuleta County, CO", 
"Archuleta County, CO"), fipscounty = c(8007L, 8007L, 8007L), 
    neighborname = c("Rio Grande County, CO", "Rio Arriba County, NM", 
    "San Juan County, NM"), fipsneighbor = c(8105L, 35039L, 35045L
    )), class = "data.frame", row.names = c(NA, -3L))

推荐文章

T K · 在第一列中添加具有特定值的新行,然后在其余列中添加“-”

2 年前

HoelR · 每N列将数据帧拆分为多个

2 年前

bandcar · R:只保留值与另一列中的值不同的行

2 年前

stats_noob · R:R中有“非字符”命令吗?

2 年前

cliu · 根据R中连续几天的顺序分配ID

2 年前

goatstash · 从字符串数组中剪切第一个单词并存储在新变量中

2 年前

Thandi · 使用整形()和pivot_long()将宽数据转换为长数据时出错[duplicate]

2 年前

mr.bjerre · 展开R中数据表中组内的最后观察值

6 年前

aelhak · 使用group by和tidy运行多个模型并将结果提取到dataframe

6 年前

jyson · 有没有办法用dplyr的实用程序将纯文本数据重塑为常规表格数据?

6 年前