代码之家 › 专栏 › 技术社区 › zoowalk

purr:如何将一个列表与多个嵌套列表相交

purrr r

zoowalk · 技术社区 · 5 年前

我有一个包含政府中各方的数据框架。这些参与方嵌套在按句点(=每年)分组的列表列中。

我想比较一下每个政府和以前的政府之间的重叠。

library(tidyverse)

df <- tibble::tribble(
  ~period, ~party, ~seats,
        1,    "A",      2,
        1,    "B",      3,
        1,    "C",      3,
        2,    "A",      2,
        2,    "C",      3,
        3,    "C",      4,
        3,    "E",      1,
        3,    "F",      3
  )


df1 <- df %>% 
  group_by(period) %>% 
  nest() %>% 
  mutate(gov=map(data, "party") %>% map(.,list)) %>% 
  mutate(prev.govs=map(data, "party") %>% 
           map(., list) %>%
           accumulate(.,union))

为了进行比较,我创建了一个列表,其中包括每个前政府的嵌套列表。( prev.govs )应比较每个嵌套列表( intersect )包括现任政府的名单( gov )这就是我被卡住的地方。

我试着用 map2 的 purrr 将包含本政府当事方的名单与包含前一政府当事方的(嵌套)名单进行打包和比较。不幸的是,我被卡住了。

失败的方法:

df2 <- df1%>% 
  mutate(rep=map2(.x=gov, .y=prev.govs, .f=intersect))

df2 <- df1%>% 
  mutate(rep=map(gov, ~map2(., prev.govs, intersect)))

df2 <- df1%>% 
  mutate(rep=modify_depth(prev.govs, 2, ~map2(.,gov, intersect)))
#> Error in mutate_impl(.data, dots): Evaluation error: Mapped vectors must have consistent lengths:
#> * `.x` has length 2
#> * `.y` has length 3.

我想得到的是,每个时期都有一个列表,其中包含每个前政府的嵌套列表。每个嵌套列表都包含与当前政府重叠的各方。两个清单上的一个简化案例有望使这一点充分清晰:

new <- list(c("A" ,"C", "E", "F"))
old <- list(c("A", "B", "C"), c("A", "C"), c("D", "E", "F"))

map2(new, old, intersect)
#> [[1]]
#> [1] "A" "C"
#> 
#> [[2]]
#> [1] "A" "C"
#> 
#> [[3]]
#> [1] "E" "F"

1 回复 | 直到 5 年前

lkq 5 年前

我认为下面的语法更清晰,也更便于调试,因为您可以在第一个map2代码块中抛出一个断点,并检查数据的形状。

df1$comparison <- map2(df1$gov, df1$prev.govs, function(curGov, prevGov) {
  map2(curGov, prevGov, intersect)
})

但是如果你想坚持 mutate ,您可以执行以下操作。但是,我认为它非常混乱,最好只使用完整命名函数。

df1 <- df1 %>% mutate(comparison = map2(gov, prev.govs, ~map2(.x, .y, intersect)))

# or better use named parameters

df1 <- df1 %>%
  mutate(
    comparison = map2(
      gov, 
      prev.govs,
      function(curGov, prevGov) {
        map2(curGov, prevGov, intersect)
      }
    )
  )

推荐文章

MCP_infiltrator · 在“tible”中添加一列,给出其列表位置

2 年前

sbac · 如何对R中数据帧的几列应用统计测试

2 年前

John-Henry · 使用“purrr::map”将“lm”对象循环到“broom::tidy”`

2 年前

deschen · 将列乘以向量的tidyverse解决方案

2 年前

Nuller · 无法对嵌套数据中的列进行子集设置。框架

2 年前

chrischi · R Purrr-系数最高

6 年前

Richard Herron · 从purr的pmap()调用var()返回NA

6 年前

Davide Lorino · 嵌套数据帧上的函数向量算法

6 年前

âÊÊá¸á¸½á¸ · 如何使用purrr从两个元素的列表中提取元素?

6 年前

andrew_reece · map\u dfr:填充。具有字符串标签的id列,而不是没有字符串标签的索引。x已命名

6 年前