0

我有一个长长的列表,格式如下:

group1 » group2 » group3

在 R 中,我可以使用gsub('»', '-', x)wherex是上述结构的向量。

但是,在将其加载到闪亮的应用程序时尝试使用此功能时,我遇到了错误。我尝试了多种使用gsub,chartr和其他一些方法。

此外,Â使用[[:punct:]].

有什么建议么?

4

1 回答 1

0

group1 » group2 » group3是一个UTF-8编码的字符串,因此最好将R应用程序编码为通过从 UTF-8 转换为拉丁语 1 来读取字符串,如读取或设置字符向量的声明编码并将文本读取为 UTF -8 编码

»是 UTF-8 编码的右指向双角引号,其中具有十六进制值 C2 BB 的 2 个字节被解释并使用代码页Windows-1252ISO 8859-1 (Latin-1) 显示(错误)。

gsub("\\xC2?\\xBB", "-", x)可用于在 UTF-8 编码字符串或单字节编码字符串(Latin 1 或 Windows 1252)中查找所有正确的指向 guillemets,并用连字符替换它们中的每一个。

于 2014-07-26T12:43:34.860 回答