我有一个数据框,其中一列中有一组字符串,另一列中有一个分组变量(一个字符串,但可能是一个因素)。我想要collapse
数据框,以便通过分组变量将字符串折叠成元素。对于信息,然后我将使用Corpus(VectorSource(x))
该向量(即,我正在折叠以创建文档)。
例如:
eg Type
1 tomato F
2 mushrooms F
3 snow W
4 chips F
5 rain W
这将被转换为具有两个元素的字符向量,即“W”的成员和“F”的成员。我知道我可以使用:
a <- paste(x$eg,collapse=" ")
要获得所有这些,当然只需手动创建子集(或循环)。我想知道是否有一个plyr
功能(但看不到一个),我认为tapply
或者by
可能是我正在寻找的(在基础中),但我不清楚它们将如何在这里使用。
我不想在这里输出数据框,而是清楚地探索标记的重复项,这些方法适用于这个问题。