我在文本中分析了一些品牌,以找出 KPI,例如广告识别。但是到目前为止,包含特殊字符的品牌都被我的代码破坏了。
library(qdap)
library(stringr)
test <- c("H&M", "C&A", "Zalando", "Zalando", "Amazon", "Sportscheck")
wfm(test)
这是输出:
all
a 1
amazon 1
c 1
h 1
m 1
sportscheck 1
zalando 2
有没有一种包装或方法来归档 H&M 得到 h&m,而不是像它的两个品牌那样的“h”和“m”?
编辑: wfm 函数有一个 ... 参数,应该允许我使用 strip 函数。
wfm(test, ... = strip(test, char.keep = "&"))
不幸的是不起作用。