0

我无法将列表中 2 个数据框的列转换为数字。现在两个数据框都有两列由因子组成。我想将它们转换为数字,以便我可以对它们进行数学运算。下面是示例代码:

library(XML)

bal <- "http://www.baseball-reference.com/teams/BAL/2014-schedule-scores.shtml"
bos <- "http://www.baseball-reference.com/teams/BOS/2014-schedule-scores.shtml"

mylist <- list(bal, bos)

a <- lapply(mylist, readHTMLTable)
b <- lapply(a, function(x) x[["team_schedule"]][, c("R", "RA")])
c <- as.numeric(as.character(b))

当我运行此代码时,我得到:

> c
[1] NA NA
> str(c)
 num [1:2] NA NA

b的结构如下:

> str(b)
List of 2
 $ :'data.frame':   165 obs. of  2 variables:
  ..$ R : Factor w/ 13 levels "","0","10","11",..: 6 6 7 8 10 7 6 5 9 2 ...
  ..$ RA: Factor w/ 13 levels "","0","1","10",..: 3 9 7 4 10 3 7 8 7 6 ...
 $ :'data.frame':   166 obs. of  2 variables:
  ..$ R : Factor w/ 10 levels "","0","1","2",..: 3 8 6 4 8 2 7 9 6 3 ...
  ..$ RA: Factor w/ 13 levels "","1","10","14",..: 5 5 6 9 10 7 2 3 5 7 ...

我应该怎么做才能将因子转换为数值?

4

1 回答 1

1

你需要使用 lapply。str在“b”上做a

str(b)

这将让您知道您有 2 个 data.frames 中的 2 个列表。

因此,您需要将 lapply 与 sapply 一起使用,以保留数据结构

lapply(b, function(x) sapply(x, function(x) as.numeric(as.character(x))))

您的因子中有 D/N,它将被转换为 NAs 以及空白/空的列表条目

于 2014-04-29T15:56:37.683 回答