3

我有一个包含 100 个变量的数据框,我希望将其中的一个子集,比如 dataframename[,30:50] 转换为其原始数值(1、2、3、4、5)。

我知道我应该as.numeric(levels(f))[f]在转换一个因子时使用,但我只能在一次转换一个因子时才能完成这项工作。我想一次将它们全部转换。

这行不通:

as.numeric(levels(dataframename[,30:50]))[dataframename[,30:50]]  

这也不会:

sapply(dataframename[,30:50],as.numeric(levels(dataframename[,30:50]))    
[dataframename[,30:50]]  

我应该阅读任何想法或东西吗?

4

2 回答 2

6

这是一个较小的例子,但这个想法应该成立。您可以使用lapply将转换应用于数据框的每一列,然后直接替换这些列。

# make example data
dat <- as.data.frame(lapply(as.data.frame(matrix(seq(2*3), ncol = 3)), factor))

factorconvert <- function(f){as.numeric(levels(f))[f]}
dat[, 2:3] <- lapply(dat[, 2:3], factorconvert)
dat
#  V1 V2 V3
#1  1  3  5
#2  2  4  6
#str(dat)
#'data.frame':  2 obs. of  3 variables:
# $ V1: Factor w/ 2 levels "1","2": 1 2
# $ V2: num  3 4
# $ V3: num  5 6
于 2012-10-12T23:04:21.797 回答
1

我喜欢@Dason的回答。有一种方法可以仅在一行中执行此操作,您可以将分解仅应用于感兴趣的列并使用匿名函数,例如:

dataframename[,30:50] <- lapply(dataframename[,30:50], function(f) as.numeric(levels(f))[f])

请注意,列不必是连续的,即您可以使用典型的 c(col1:col10, col20) 子集语法。

于 2014-08-27T18:56:23.707 回答