代码之家 › 专栏 › 技术社区 › Ameya

平均值与tapply。唯一性(ave)==taply始终?如果是这样,为什么会有一个存在?

r-base r

Ameya · 技术社区 · 6 年前

考虑以下内容-

set.seed(1)
x <- runif(100)
y <- sample(c('M', 'F', 'D'), 100, TRUE)
aveResult <- ave(x = x, y, FUN = sum)
tapplyResult <- tapply(x, y, sum)
aveResult <- setNames(aveResult, y)
tapplyResult
aveResult[!duplicated(names(aveResult))]

两个函数的结果是相同的,除了输出的长度。此外,这也会造成混乱(由于回收而加剧),如 this case .

有没有一个例子,其中一个函数可以做另一个不能做的事情?

2 回复 | 直到 6 年前

akrun 6 年前

ave base R mean dplyr data.table

set.seed(24)
df1 <- data.frame(grp = sample(LETTERS, 1e6, replace = TRUE), val = rnorm(1e6))
system.time(with(df1, ave(val, grp)))
#   user  system elapsed 
#  0.070   0.004   0.073 

library(dplyr)
system.time(df1 %>%
              group_by(grp) %>%
              mutate(new = mean(val)))
#   user  system elapsed 
#  0.159   0.000   0.160 

library(data.table)
system.time(setDT(df1)[, new := mean(val), by = grp])
#  user  system elapsed 
#  0.056   0.000   0.057

tapply tidyverse sort unique list

tapply(1:10, rep(LETTERS[1:3], c(3, 3, 4)), FUN = range)

ave(1:10, rep(LETTERS[1:3], c(3, 3, 4)), FUN = range)

Maurits Evers 6 年前

by(x, y, FUN = sum)

ave tapply by

ave(x, y, FUN = sum) x y length(x)
tapply(x, y, sum)
by(x, y, sum)

dplyr

group_by mutate

data.frame(x, y) %>% group_by(y) %>% mutate(x = sum(x)) %>% pull(x)

summarise

data.frame(x, y) %>% group_by(y) %>% summarise(x = sum(x)) %>% pull(x)

vector data.frame matrix

推荐文章

Marc B. · 使用ggplot2创建条形图时“缺少值”

1 年前

deschen · tidyverse与外部向量发生突变,该外部向量的元素是数据帧中的列值

1 年前

Laura · 在Shiny中使用可排序的包拖放名称,这些名称将成为图表

1 年前

Mallikarjun M · 如何使用随机森林进行时间序列预测?

1 年前

ly li · 模型摘要:当表格形状改变时,拟合优度消失

1 年前

C.Robin · 将marginaffects::predictions()的结果连接回main df?

1 年前

monotonic · 如何将格式为“col1+col3+col4”的数据帧的行名转换为一列数字向量“c(1,3,4)”?

2 年前

Shawn Hemelstrand · 为什么我的自定义errorbar函数不能在R中工作?

2 年前

RoyBatty · 统计每个字符在整个数据集中出现的次数

2 年前

stats_noob · R: 记录某个“行为”发生的循环的索引?

2 年前