我有一个如下所示的 CSV 数据集:
Age;Functions;...
12;1,2,5;...
45;1,4,5,8;...
23;3;...
第一列是参与者的年龄,第二列是问题 1 的多项选择答案的逗号分隔列表。在此示例中,第一个参与者选中第 1、2 和第 5 个复选框,第 3 个参与者仅选中第 3 个复选框.
现在,我想评估问题 1 的答案。第一步是绘制每个可能答案的答案数量。我尝试了以下方法:
dataset$Functions <- strsplit(as.character(dataset$Functions), ",", fixed=T)
dataset$Functions <- lapply(dataset$Functions, factor, levels = 0:8, labels=c(
"no answer",
"checkbox 1",
"checkbox 2",
"checkbox 3",
"checkbox 4",
"checkbox 5",
"checkbox 6",
"checkbox 7",
"checkbox 8",
))
另外我尝试使用 mChoice:
library("Hmisc")
dataset$Functions <- lapply(dataset$Functions, mChoice, label="Functions")
但是现在,我不知道如何处理数据框中的列表。你有想法吗?