83

tm包扩展,c因此,如果给定一组PlainTextDocuments,它会自动创建一个Corpus. 不幸的是,似乎每个都PlainTextDocument必须单独指定。

例如,如果我有:

foolist <- list(a, b, c); # where a,b,c are PlainTextDocument objects

我会这样做以获得Corpus

foocorpus <- c(foolist[[1]], foolist[[2]], foolist[[3]]);

'PlainTextDocument我有一个如下所示的 s列表列表:

> str(sectioned)
List of 154
 $ :List of 6
  ..$ :Classes 'PlainTextDocument', 'TextDocument', 'character'  atomic [1:1] Developing assessment models   Developing models
  .. .. ..- attr(*, "Author")= chr "John Smith"
  .. .. ..- attr(*, "DateTimeStamp")= POSIXlt[1:1], format: "2013-04-30 12:03:49"
  .. .. ..- attr(*, "Description")= chr(0) 
  .. .. ..- attr(*, "Heading")= chr "Research Focus"
  .. .. ..- attr(*, "ID")= chr(0) 
  .. .. ..- attr(*, "Language")= chr(0) 
  .. .. ..- attr(*, "LocalMetaData")=List of 4
  .. .. .. ..$ foo           : chr "bar"
  .. .. .. ..$ classification: chr "Technician"
  .. .. .. ..$ team          : chr ""
  .. .. .. ..$ supervisor    : chr "Bill Jones"
  .. .. ..- attr(*, "Origin")= chr "Smith-John_e.txt"

#etc., all sublists have 6 elements

因此,要将我的所有PlainTextDocuments 放入 aCorpus中,这将起作用:

sectioned.Corpus <- c(sectioned[[1]][[1]], sectioned[[1]][[2]], ..., sectioned[[154]][[6]])

有人可以建议一个更简单的方法吗?

ETA:foo<-unlist(foolist, recursive=FALSE)生成一个普通文本文档的平面列表,这仍然给我留下了逐个元素提供列表元素的问题c

4

3 回答 3

94

我希望这unlist(foolist)会对你有所帮助。它有一个recursive默认选项TRUE

所以unlist(foolist, recursive = FALSE)将返回文档列表,然后您可以通过以下方式组合它们:

do.call(c, unlist(foolist, recursive=FALSE))

do.call只是将函数应用于c获得的列表的元素

于 2013-04-30T12:58:40.700 回答
32

当列表嵌套多次并且列表元素之间的嵌套量不同时,这是一个更通用的解决方案:

 flattenlist <- function(x){  
  morelists <- sapply(x, function(xprime) class(xprime)[1]=="list")
  out <- c(x[!morelists], unlist(x[morelists], recursive=FALSE))
  if(sum(morelists)){ 
    Recall(out)
  }else{
    return(out)
  }
}
于 2017-01-26T20:58:34.943 回答
8

这是另一种适用于我的列表的方法。

df <- as.data.frame(do.call(rbind, lapply(foolist, as.data.frame)))

或者看看 tidyr 中运行良好的新功能。

将嵌套列表矩形成一个整洁的小标题

长方形

    lst <-  list(
      list(
        age = 23,
        gender = "Male",
        city = "Sydney"
      ),
      list(
        age = 21,
        gender = "Female",
        city = "Cairns"
      )
    )
      
    tib <- tibble(lst)  %>% 
      unnest_wider(lst)

df <- as.data.frame(tib)
于 2020-09-24T05:22:28.967 回答