代码之家  ›  专栏  ›  技术社区  ›  spore234

在R中生成分层自举重采样

  •  0
  • spore234  · 技术社区  · 9 年前

    假设我有一个包含3个变量和7行的数据帧

    df <- data.frame(V1=c(0,1,0,0,0,1,0), V2=rnorm(7), V3=rnorm(7))
    

    我如何创建一个具有20行的引导数据帧,其中V1中0和1的分布大致相同,即它应该包含相同数量的0和1?谢谢

    我看了一些包裹,例如。 boot ,但我不想计算自举统计,我只需要数据集。

    1 回复  |  直到 9 年前
        1
  •  4
  •   ExperimenteR    9 年前

    您可以使用 sample_n 从…起 dplyr 包裹

    library(dplyr)
    df %>% 
      group_by(V1) %>% 
      sample_n(10, replace=T)