r - 在数据框行上运行 purrr::map_dfr？

Question

给定一个dataframe，比如说iris默认值，如何配置purrr::map_dfr()函数以在每一行上运行dataframe并执行函数foo。

这是我的 df 的一行，请注意该值始终是一个大 JSON：

structure(list(Key = "2019/01/04/14/kuku@pupu.com_2ed026cb-8e9f-4392-9cc4-9f580b9d3aab_1345a5a4-3d5b-48a0-a678-67ed09a6f487_2019-01-04-14-52-43-537", 
    LastModified = "2019-01-04T14:52:44.000Z", ETag = "\"1c6269ab8b7baa85f0d2567de417f0d0\"", 
    Size = 35280, Owner = "e7c0d260939d15d18866126da3376642e2d4497f18ed762b608ed2307778bdf1", 
    StorageClass = "STANDARD", Bucket = "comp-kukupupu-streamed-data", 
    user_name = "kuku@pupu.com", value = list(---here goes a large json), 
    obs_id = 1137L), row.names = 1L, class = "data.frame")

我的功能是：

extract_scroll_data <- function(df) {

  tryCatch({

    j <- fromJSON(unlist(df$value))

    if (is_empty(fromJSON(j$sensorsData)) | is_empty(fromJSON(j$eventList))) {

      return(tibble())

    } else {

      return(set_names(as_tibble(fromJSON(j$eventList, bigint_as_char = TRUE), 
                                 .name_repair = "unique"), 
                       nm = c("time_stamp", 
                              "x", "y", "size", 
                              "pressure", "scroll", "state")) %>%
               dplyr::mutate("user_name" = df$user_name,
                             "obs_id" = df$obs_id))
    }

  }, warning = function(war) {

    # Warning handler picks up where error was generated:
    print(paste0("Warning: occured at ", df$obs_id, war))

  }, error = function(err) {

    # error handler picks up where error was generated
    print(paste0("Error: occured at ", df$obs_id, err))

  }, finally = {

    gc()

  })

}

请告知为什么它不使用数据框行？

score 2 · Accepted Answer

map_dfr()，因为家庭的任何其他成员map迭代列表并且data.frame实际上是列列表。typeof(iris)您可以使用和进行检查as.list(iris)。要map_dfr()改为对行进行迭代，您必须将您的行转换data.frame为具有split()函数的行列表。

iris %>%
  split(1:nrow(.)) %>%
  purrr::map_dfr(do_stuff)

r - 在数据框行上运行 purrr::map_dfr？

1 回答 1

Related

Reference