7

我有数据集,哪个负值在数字周围用括号表示,即(10)==-10它是 csv 格式,我该如何处理它以便 R 将其解释(10)-10?谢谢你。

更新我知道我可以通过替换(as -、 remove)as.numeric之后使用来解决这个问题,但是有没有更优雅的方法来解决这个问题?

4

2 回答 2

10

如果您为会计格式创建“as.acntngFmt”方法,您可以阅读(或者可能使用 colClasses("acnt") 通过文本连接重新阅读。

 setClass("acntngFmt")
 # [1] "acntngFmt"
 setAs("character", "acntngFmt",
    function(from) as.numeric( gsub("\\)", "", gsub("\\(", "-", from))))

  Input <- "A, B, C
  (1.76), 1%, 3.50€
  2.00, 2%, 4.77€
  3.000, 3% , €5.68"

   DF <- read.csv(textConnection(Input), header = TRUE,
     colClasses = c("acntngFmt", "character", "character"))
   str(DF)
'data.frame':   3 obs. of  3 variables:
 $ A: num  -1.76 2 3
 $ B: chr  "1%" "2%" "3%"
 $ C: chr  "3.50€" "4.77€" "€5.68"
于 2011-02-21T18:18:17.110 回答
0

如果您知道周围的括号将是单元中唯一的括号,您可以创建一个函数来处理它们:

test <- c(10, "(10)", 5)
negative_paren <- function(vec){
  #the backspace escapes the special "(" character
  vec <- gsub("\\(","-",vec) 
  vec <- gsub("\\)","",vec)
  vec <- as.numeric(vec)
  return(vec)
}
negative_paren(test)
[1]  10 -10   5
于 2020-09-25T06:16:22.050 回答