我有数据集,哪个负值在数字周围用括号表示,即(10)==-10
它是 csv 格式,我该如何处理它以便 R 将其解释(10)
为-10
?谢谢你。
更新我知道我可以通过替换(
as -
、 remove)
和as.numeric
之后使用来解决这个问题,但是有没有更优雅的方法来解决这个问题?
我有数据集,哪个负值在数字周围用括号表示,即(10)==-10
它是 csv 格式,我该如何处理它以便 R 将其解释(10)
为-10
?谢谢你。
更新我知道我可以通过替换(
as -
、 remove)
和as.numeric
之后使用来解决这个问题,但是有没有更优雅的方法来解决这个问题?
如果您为会计格式创建“as.acntngFmt”方法,您可以阅读(或者可能使用 colClasses("acnt") 通过文本连接重新阅读。
setClass("acntngFmt")
# [1] "acntngFmt"
setAs("character", "acntngFmt",
function(from) as.numeric( gsub("\\)", "", gsub("\\(", "-", from))))
Input <- "A, B, C
(1.76), 1%, 3.50€
2.00, 2%, 4.77€
3.000, 3% , €5.68"
DF <- read.csv(textConnection(Input), header = TRUE,
colClasses = c("acntngFmt", "character", "character"))
str(DF)
'data.frame': 3 obs. of 3 variables:
$ A: num -1.76 2 3
$ B: chr "1%" "2%" "3%"
$ C: chr "3.50€" "4.77€" "€5.68"
如果您知道周围的括号将是单元中唯一的括号,您可以创建一个函数来处理它们:
test <- c(10, "(10)", 5)
negative_paren <- function(vec){
#the backspace escapes the special "(" character
vec <- gsub("\\(","-",vec)
vec <- gsub("\\)","",vec)
vec <- as.numeric(vec)
return(vec)
}
negative_paren(test)
[1] 10 -10 5