我使用xlsx
包将 excel 文件读入数据框y
。虽然我的 excel 文件的某些单元格包含字符“-”,但当它们被读入 R 时,它们变为“\xe2\u0080\x94”。我想用NA
或其他字符替换这些字符串。但是,即使在数据框中,我也无法正确定位它们。
any(y=="\\xe2\\u0080\\x94")
[1] FALSE
我怎样才能找到它们并更换它们?
我使用xlsx
包将 excel 文件读入数据框y
。虽然我的 excel 文件的某些单元格包含字符“-”,但当它们被读入 R 时,它们变为“\xe2\u0080\x94”。我想用NA
或其他字符替换这些字符串。但是,即使在数据框中,我也无法正确定位它们。
any(y=="\\xe2\\u0080\\x94")
[1] FALSE
我怎样才能找到它们并更换它们?
这有帮助吗:
x <- data.frame(y=c(1,2,3,"\\xe2\\u0080\\x94"))
x
y
1 1
2 2
3 3
4 \\xe2\\u0080\\x94
x$y[ x$y %in% "\\xe2\\u0080\\x94" ] <- NA
x
y
1 1
2 2
3 3
4 <NA>
但我认为你应该提供一个建议的数据片段,因为它表明我无法重现错误,例如
library(xlsx)
x <- read.xlsx("sillyexample.xlsx",1)
> x
y z
1 a a2d-23
2 b b
3 c c