代码之家 › 专栏 › 技术社区 › SeGa

用基r拆分列表中重复的矩阵行

duplicates matrix r

SeGa · 技术社区 · 6 年前

我有一个矩阵列表,列中有重复的值 id . 如何拆分所有列表元素中的重复项?

我的工作方式 data.frames 是与 lapply + split + duplicated 但这不适用于矩阵,因为它们也被分解成了数字。我想保留矩阵结构。

## Data.frame - all good
df <- data.frame(
  id = rep(1:10, each = 2),
  val = rep(10, each = 20)
)
df_list <- rep(list(df), 2);
lapply(df_list, function(x){split(x, duplicated(x[,'id']))$'FALSE'})

## Matrix - Here's my problem
mt <- as.matrix(data.frame(
  id = rep(seq(1,10,1), each = 2),
  val = rep(10, each = 20)
))
mt_list <- rep(list(mt), 2)
lapply(mt_list, function(x){split(x, duplicated(x[,'id']))$'FALSE'})

2 回复 | 直到 6 年前

BENY 6 年前

也许试试

split(df,ave(df$id, df$id, FUN= function(x) seq_along(x)))
$`1`
   id val
1   1  10
3   2  10
5   3  10
7   4  10
9   5  10
11  6  10
13  7  10
15  8  10
17  9  10
19 10  10

$`2`
   id val
2   1  10
4   2  10
6   3  10
8   4  10
10  5  10
12  6  10
14  7  10
16  8  10
18  9  10
20 10  10

SeGa 6 年前

在写这个问题和修改代码的时候,我想出了一个解决方案。因为我没有找到关于这个特定设置的任何信息,所以我还是会发布它。

功能 subset / subset.matrix 工作:

lapply(mt_list, function(x){subset.matrix(x, !duplicated(x[,'id']))})

我把不同的选择作为基准; 子矩阵 似乎比刚才快了一点 子集 .

 mt <- as.matrix(data.frame(
  id = rep(seq(1,1000,1), each = 2),
  val = rep(1000, each = 20)
))
mt_list <- rep(list(mt), 50)
mc <- microbenchmark::microbenchmark(
  subset = lapply(mt_list, function(x){subset(x, !duplicated(x[,'id']))}),
  subset.matrix = lapply(mt_list, function(x){subset.matrix(x, !duplicated(x[,'id']))}),
  split = lapply(mt_list, function(x){matrix(split(x, duplicated(x[,'id']))$'FALSE', ncol = 2)}),
  unique = lapply( mt_list, unique )
)
mc

Unit: milliseconds
          expr        min         lq       mean     median         uq        max neval cld
        subset   3.758708   3.862849   4.256363   3.900580   3.981629   9.713416   100 a  
 subset.matrix   3.583632   3.700450   4.174137   3.729881   3.821947   9.611992   100 a  
         split  32.630604  33.061503  34.535531  33.262841  33.726039  77.531039   100  b 
        unique 144.832487 148.408874 155.099591 150.326865 155.456601 430.992916   100   c

推荐文章

Rodrigo Crespo Miguel · 在Python中创建矩阵时遇到问题:维度错误

1 年前

Onur · R中矩阵的循环

2 年前

user9740934 · R-在定义的阈值上选择矩阵列表中存在的相同行的时间高效方法

6 年前

Karpov · 巨大的广播变量,没有parfor优化代码?

6 年前

Shika93 · Matlab元素位置

6 年前

nymuffin · 在R中创建非对称对角线为0s的1s非对称矩阵

6 年前

synchronizer · 使用openGL、glm math和正交投影,旋转时扭曲的形状

6 年前

Jakub Wagner · 厄米矩阵的特征向量[闭]

6 年前

yankeefan11 · 网格每个点处的矩阵

6 年前

Patrick · 将字母向量拆分为大小相等的向量[重复]

6 年前