我有 tibble wherecol1
是可变长度的字符向量列表,并且col2
是表示组分配的数字向量,1 或 0。我想首先将列表 ( col1
) 中的所有字符向量转换为因子,然后统一所有这些因素的因素水平,以便我最终可以获得每个因素水平的计数。对于下面的示例数据,这意味着计数如下:
全面的:
level, count
"a", 2
"b", 2
"c", 2
"d", 3
"e", 1
对于组 = 1:
level, count
"a", 1
"b", 2
"c", 1
"d", 1
"e", 0
对于组 = 0:
level, count
"a", 1
"b", 0
"c", 1
"d", 2
"e", 1
最终目标是能够获得每个因子水平的总数c("a","b","c","d","e")
并通过分组变量绘制它们。
下面是一些代码,可以为我的问题提供更好的上下文:
library(forcats)
library(purrr)
library(dplyr)
library(ggplot2)
tib <- tibble(col1=list(c("a","b"),
c("b","c","d"),
c("a","d","e"),
c("c","d")),
col2=c(1,1,0,0))
tib %>%
mutate(col3=map(.$col1,.f = as_factor)) %>%
mutate(col4=map(.$col3,.f = fct_unify))
不幸的是,这段代码失败了。我收到以下错误,但不知道为什么:
Error:
fsmust be a list
我以为我的输入是一个列表?
我感谢任何人可能提供的任何帮助。谢谢。