1

我正在使用 R 进行网络抓取,并且我有一个脚本可以复制链接的文本,然后使用此字符串使用 RSelenium 跟踪链接。不幸的是,当我运行脚本时,这似乎不适用于一个特定的字符串,但是当我用手动输入的字符串替换保存的字符串时,它工作正常。稍微深入研究一下页面的 html,就会发现其中一个空格字符实际上是一个字符,这就是字符串无法匹配的原因。如何用 R 中的普通空格替换?我尝试使用 stringr 库和 str_replace 命令,如下所示:

var1 <- str_replace(var1, pattern = "&nbsp;", " ")

但这似乎不起作用。有什么我明显做错了吗?有没有办法让 R 显示一个字符串,其中所有奇怪的格式字符都可见?

4

1 回答 1

4

你需要\u00A0as 替换 char 所以var1 <- gsub("\u00A0", "", var1, fixed =TRUE)

于 2016-11-07T10:15:37.633 回答