0

我有一列用“/”或“-”分隔的单词。

|Column1|
|box-apple/bike-box|
|apple/orange-box-box-box|

我想解析重复词,只保留第一个实例和“/”或“-”,因为它们很重要。

Output
|Column1|
|box-apple/bike|
|apple/orange-box|

可重现的数据集:

data.frame(x = c(('box-apple/bike-box'),('apple/orange-box-box-box')))

任何帮助将非常感激。谢谢你。

这甚至可能吗?

好的,我现在可以使用:

sapply(table10$CONCEPT_NAME, function(x) paste(unique(unlist(strsplit(x, " - "))), collapse = " - "))

但我只能从数据框中取回那一列。无论如何我可以应用这个函数并从我的数据框中获取所有列吗?

4

1 回答 1

0

好吧想通了。这是使上述问题起作用的代码:

sapply(table10$CONCEPT_NAME, function(x) paste(unique(unlist(strsplit(x, " - "))), collapse = " - "))

并返回原始数据

table10$CONCEPT_NAME <- sapply(table10$CONCEPT_NAME, function(x) paste(unique(unlist(strsplit(x, " - "))), collapse = " - "))

您只需覆盖该列。

于 2018-06-21T20:45:49.393 回答