3

我有一个由“;”分隔的类别列。IE 值:

value <- "A > B > C; A > B > D; A > B > C > C1"

它的意思是:

当前产品属于“A > B > C”类别,属于“A > B > D”类别和“A > B > C > C1”类别

如果一个类别已包含在另一个类别中,则应将其删除。所以目标是:

expectedResult <- "A > B > D; A > B > C > C1"

因为“A > B > C > C1”包含“A > B > C”。

我该如何解决这个问题?

注意:我知道有数百个问题看起来很相似。但我只是找不到解决方案。

4

2 回答 2

1

这应该有效:


value <- "A > B > C; A > B > D; A > B > C > C1"
els <- strsplit( value, "; " )[[1]]

my_reducer  <- function(a,b) {
    v <- str_detect( b, fixed(a) )
    a <- a[!v]
    append(a,b)
}

paste( Reduce( my_reducer, els ), collapse="; " )

输出:


> Reduce( my_reducer, els )
[1] "A > B > D; A > B > C > C1"

于 2021-05-04T08:56:46.237 回答
0

Perhaps you can try the code below

v <- unlist(strsplit(value, ";\\s+"))
idx <- colSums(`diag<-`(sapply(v, function(x) {
  p <- gsub(x, "", v, fix = TRUE)
  p != v & nchar(p) > 0
}), FALSE)) == 0
paste0(names(idx)[idx], collapse = "; ")

which gives

[1] "A > B > D; A > B > C > C1"
于 2021-05-04T08:59:16.380 回答