考虑我是一个 n00b,但我已经在这里搜索了我的特定查询,但我还没有找到答案。我的问题如下。考虑以下代表我的数据集的简化 csv 文件 r_split.csv:
id,v1,v2,v3,v4,str
1,2.4,2.4,345.5,234.2,gbbc
2,4.5,2.56,7.45,34.6,ebird
3,3.4,5.6,4.45,6.3,ebird_can
第一行包含标题名称。您可以看到 str 列包含 3 个不同的字符串值,即gbbc, ebird, ebird_can
. 我的目标是将这个大数据集分成 2 个数据集。第一个将仅包含所有 str 值 = gbbc
,第二个将包含所有 str 值并重ebird
命名ebird_can
为allebird
。
我可以使用以下命令将数据集拆分为 3 个不同的数据集:
splitted<-split(rsplit,rsplit$str)
但是,我无法弄清楚如何使用 str 列的 2 个不同值并将它们组合成第三个。有人可以帮帮我吗?
谢谢。