r - 解析由非字母字符分隔的列中的单词

Question

我有一列用“/”或“-”分隔的单词。

|Column1|
|box-apple/bike-box|
|apple/orange-box-box-box|

我想解析重复词，只保留第一个实例和“/”或“-”，因为它们很重要。

Output
|Column1|
|box-apple/bike|
|apple/orange-box|

可重现的数据集：

data.frame(x = c(('box-apple/bike-box'),('apple/orange-box-box-box')))

任何帮助将非常感激。谢谢你。

这甚至可能吗？

好的，我现在可以使用：

sapply(table10$CONCEPT_NAME, function(x) paste(unique(unlist(strsplit(x, " - "))), collapse = " - "))

但我只能从数据框中取回那一列。无论如何我可以应用这个函数并从我的数据框中获取所有列吗？

score 0 · Accepted Answer

好吧想通了。这是使上述问题起作用的代码：

sapply(table10$CONCEPT_NAME, function(x) paste(unique(unlist(strsplit(x, " - "))), collapse = " - "))

并返回原始数据

table10$CONCEPT_NAME <- sapply(table10$CONCEPT_NAME, function(x) paste(unique(unlist(strsplit(x, " - "))), collapse = " - "))

您只需覆盖该列。

1 回答 1