代码之家 › 专栏 › 技术社区 › Todd Shannon

筛选组上的值数据表[副本]

subset data.table r

Todd Shannon · 技术社区 · 7 年前

我在找一个过滤器 data.table 对于组的最大值。

DT <- data.table(V1 = c(1L, 2L),
                 V2 = LETTERS[1:3],
                 V3 = round(rnorm(4), 4),
                 V4 = 1:12)

 V1 V2     V3     V4
 1:  1  A -0.1346  1
 2:  2  A  0.2309  4
 3:  1  A  0.7067  7
 4:  2  A -1.0082 10
 5:  2  B -1.0082  2
 6:  1  B -0.1346  5
 7:  2  B  0.2309  8
 8:  1  B  0.7067 11
 9:  1  C  0.7067  3
10:  2  C -1.0082  6
11:  1  C -0.1346  9
12:  2  C  0.2309 12

我试过了,但没用:

DT[,max(V3), by =.(V2)]

   V2     V1
1:  A 1.2281
2:  B 1.2281
3:  C 1.2281

如果没有一个循环,我将如何处理这个问题?我更喜欢一个数据表方法。

1 回复 | 直到 7 年前

akrun 5 年前

我们可以创建一个行索引来子集数据集

DT[DT[, .I[V3 == max(V3)], by = V2]$V1]

如果每个“V2”只有一个max元素

DT[DT[, .I[which.max(V3)], by = V2]$V1]

推荐文章

Amp · 使用R ggplot2删除geom_radial中axis.line和panel.border之间的空格

9 月前

Hard_Course · 用另一列中的值替换行的最后一个非NA条目

9 月前

Mark R · 使用geom_sf()删除地球仪上不需要的网格线

9 月前

Joe · 根据对工作日和本周早些时候的日期的了解,找到一个日期

9 月前

Ben · 统计向量中的单词在字符串中出现的频率

10 月前

TheCodeNovice · R中符号格式的尾随零和其他问题[重复]

10 月前

katefull06 · 在R中使用terra修改范围时,会为单独的SpatRaster重写范围

10 月前

dez93_2000 · 在R管道子功能中引用管道对象的当前状态

10 月前

accibio · 在ggplot2中为同一变量创建两个连续的颜色渐变比例

10 月前

Mankka · 如何在Ggplot2中绘制均匀的径向图

10 月前