代码之家 › 专栏 › 技术社区 › LucasMation

在data.table中跨组(不在组内)随机排序

data.table random r

LucasMation · 技术社区 · 6 年前

假设我想订购 iris 数据集(作为 data.table )按物种分类,保持观察结果按物种分组,并在不同物种间随机排序。

我该怎么做?

我不是说在群体(物种)中产生随机顺序。

我的直觉是写下面的代码。但它实际上产生了种内随机变量。好吧,至少这个问题是可以重复的

d <- iris %>% data.table
set.seed('12345')
d[,g:=runif(.N),Species]

3 回复 | 直到 6 年前

Mathscosta 6 年前

或者你可以:

e <- d[, .N, Species]
e[, g2 := runif(.N)]
d <- e[, .(Species, g2)][d, on = 'Species']

Henrik plannapus 6 年前

你可以在 i 是的。一个较小的例子:

d <- data.table(Species = rep(letters[1:4], each = 2), ri = 1:8)
set.seed(1)
d[.(sample(unique(Species))), on = "Species"]
#    Species ri
# 1:       b  3
# 2:       b  4
# 3:       d  7
# 4:       d  8
# 5:       c  5
# 6:       c  6
# 7:       a  1
# 8:       a  2

Hack-R 6 年前

我们可以从一系列1…n中随机抽样,其中n是因子水平( Species )有问题。

然后我们将新的顺序映射到列并按其排序。分成几个步骤进行说明,如下所示:

tmp      <- sample_n(as.data.frame(seq(1,length(unique(d$Species)))),3)[,1]
d$index  <- tmp[as.numeric(d$Species)]
d        <- d[order(d$index),]

您可以将其压缩为一行/步骤:

d <- d[order(sample_n(as.data.frame(seq(1,length(unique(d$Species)))),3)[,1][as.numeric(d$Species)]),]

推荐文章

Sarah Marie · 单击按钮,用随机颜色/大小将每个字母设置为字符串样式

2 年前

ecology · 基于R中随机生成数集的子集列

2 年前

ratus111 · 如何在Python中创建包含10个基本数字的100个值的数据帧?

2 年前

Alan Jones · 使用random从列表创建动态列表

2 年前

breking bed · 单击按钮时如何随机选择唯一编号

2 年前

Carrot Man · 如何让熊猫数据框随机填充1和0?

2 年前

Chowlett · Ruby数组#shuffle中的默认随机参数是什么

2 年前

Justin Arnold · 范围内的随机数不是随机数

2 年前

baseballdude7711 · 在10%的时间内生成一个随机数,否则生成0

2 年前

Menna Magdy · 如何使用非模型字段进行过滤?

2 年前