8

如何仅使用 purrr 包从嵌套列表中提取元素?在这种情况下,我想在拆分 data.frame 后得到一个截距向量。我已经使用 lapply() 完成了我需要的工作,但我只想使用函数 purrr 包。

library(purrr)
mtcars %>% 
split(.$cyl) %>%
map(  ~lm(mpg ~ wt, data = .)) %>%        # shorthand  NOTE: ~ lm  
lapply(function(x) x[[1]] [1]) %>% # extract intercepts  <==is there a purrr function for this line?
as_vector()                               # convert to vector

我已经尝试过 map() 和 at_depth() 但似乎没有什么对我有用。

4

2 回答 2

19

这些map函数有一些用于索引嵌套列表的速记编码。帮助页面中的一个有用片段:

要深入索引嵌套列表,请使用多个值;c("x", "y") 等价于 z[["x"]][["y"]]。

因此,使用嵌套索引的代码以及map_dbl简化为向量的代码,您可以简单地执行以下操作:

mtcars %>%
    split(.$cyl) %>%
    map(~lm(mpg ~ wt, data = .)) %>%
    map_dbl(c(1, 1))

       4        6        8 
39.57120 28.40884 23.86803 

我还发现这篇介绍 purrr 0.1.0的博客文章很有用,因为它提供了我最终使用的速记编码的更多示例。

于 2016-01-12T19:24:24.263 回答
1

使用扫帚的整洁功能

library(purrr)
library(dplyr)
#> 
#> Attaching package: 'dplyr'
#> The following objects are masked from 'package:stats':
#> 
#>     filter, lag
#> The following objects are masked from 'package:base':
#> 
#>     intersect, setdiff, setequal, union
library(tidyr)
library(broom)

cyl_group<-mtcars %>% group_by(cyl) %>% 
        nest()
        
cyl_lm<-cyl_group %>% mutate(
        mod=map(data,~lm(mpg ~ wt, data = .x))
) %>% mutate(coef=map(mod,~tidy(.x))) %>% unnest(coef)
cyl_lm
#> # A tibble: 6 x 8
#> # Groups:   cyl [3]
#>     cyl data             mod    term      estimate std.error statistic   p.value
#>   <dbl> <list>           <list> <chr>        <dbl>     <dbl>     <dbl>     <dbl>
#> 1     6 <tibble [7 x 10~ <lm>   (Interce~    28.4      4.18       6.79   1.05e-3
#> 2     6 <tibble [7 x 10~ <lm>   wt           -2.78     1.33      -2.08   9.18e-2
#> 3     4 <tibble [11 x 1~ <lm>   (Interce~    39.6      4.35       9.10   7.77e-6
#> 4     4 <tibble [11 x 1~ <lm>   wt           -5.65     1.85      -3.05   1.37e-2
#> 5     8 <tibble [14 x 1~ <lm>   (Interce~    23.9      3.01       7.94   4.05e-6
#> 6     8 <tibble [14 x 1~ <lm>   wt           -2.19     0.739     -2.97   1.18e-2

reprex 包(v0.3.0)于 2020 年 8 月 19 日创建

于 2020-08-19T06:50:01.027 回答