代码之家 › 专栏 › 技术社区 › Chris Ruehlemann

当存在NA时,如何在因子级别上对数据帧进行子集

na subset r

Chris Ruehlemann · 技术社区 · 4 年前

NA 不适用 在“系数”列中,一个 不适用 :

df1 <- data.frame(v = c("ABC", "def", "ABC", "ghi"), 
                  f = c(4.11, 3.22, NA, 7.44))

df2 <- data.frame(v = c(NA, "ABC", "def", "ABC", "ghi"), 
                  f = c(2.33, 4.11, 3.22, NA, 7.44))

df1 ,在因子水平上进行细分效果很好。例如:

df1[!df1$v == "ABC",]
    v    f
2 def 3.22
4 ghi 7.44

df2 充满了问题:

df2[!df2$v == "ABC",]
      v    f
NA <NA>   NA
3   def 3.22
5   ghi 7.44

问题有两方面:(一)与 <NA> df2$v 包含而不应包含和(ii)旁边的值(即 df2$f 不适用 2.33 .

我怎样才能子集 df2型 干净利落,结果如下:

      v    f
3   def 3.22
5   ghi 7.44

1 回复 | 直到 4 年前

Ric S 4 年前

您可以使用以下代码行

df2[!(df2$v == "ABC") & !is.na(df2$v), ]

#     v    f
# 3 def 3.22
# 5 ghi 7.44

或者还有这一行,我更喜欢这一行,因为我不需要输入几个额外的括号

df2[df2$v != "ABC" & !is.na(df2$v), ]

#     v    f
# 3 def 3.22
# 5 ghi 7.44

推荐文章

Triceratops · 从数据帧中选择不在子集中的索引

2 年前

Nate · 使用R中的多个条件删除df中的行

2 年前

RMacey · R中的矢量化(子集)赋值

6 年前

Andrea Neri · 提取数据行。表中的其他数据行。表[副本]

6 年前

user6985 · 根据从matlab或R中的第二个文件中选择的标题从文件中提取列

6 年前

MJZ · R: 有条件地应用于具有排除值的子集

6 年前

Jake · 使用for循环进行子集设置,并从该循环创建多个数据帧。

6 年前

Afke · 为绘图设置数据框导致找不到对象错误

6 年前

andemexoax · 当使用数字时,如何按名称删除R中的列?

6 年前

Luis Carmona Martinez · 创建新数据。表,并在一个变量上匹配向量列表

6 年前