因此,我正在尝试根据框架的特定列中是否包含特定单词来创建虚拟变量以附加到数据框架。该列看起来像这样:
dumcol = c("good night moon", "good night room", "good morning room", "hello moon")
我将根据每行中包含的单词创建虚拟变量,例如,对于第一行,它包含"good", "night",
and "moon"
,但不包含"room", "morning"
or "hello"
。
到目前为止,我一直在以一种非常原始的方式进行操作,即创建一个适当大小的 0 值矩阵,然后使用这样的 for 循环:
result=matrix(ncol=6,nrow=4)
wordlist=unique(unlist(strsplit(dumcal, " ")))
for (i in 1:6)
{ result[grep(wordlist[i], dumcol),i] = 1 }
或类似的东西。我猜有一种更快/更高效的方法来做到这一点。有什么建议吗?