4

我在数据框中有一列数据

Ozone   Solar.R Wind    Temp    Month   Day
41  190 7.4 67  5   1
36  118 8   72  5   2
12  149 12.6    74  5   3
18  313 11.5    62  5   4
NA  NA  14.3    56  5   5
28  NA  14.9    66  5   6
23  299 8.6 65  5   7
19  99  13.8    59  5   8
8   19  20.1    61  5   9
NA  194 8.6 69  5   10
7   NA  6.9 74  5   11
16  256 9.7 69  5   12
11  290 9.2 66  5   13
14  274 10.9    68  5   14
18  65  13.2    58  5   15

如果 Temp 列大于 70,我需要根据条件将 Temp 列更改为 1 或 0。因此,当 Temp 大于 70 时,我需要一列,当 Temp 小于 70 时,我需要一列,所以我可以使用回归Temp 作为二进制变量。

R 将采用条件语句

cfv <- mydata$Temp
x <- cfv > 70 
for(i in nrow(cfv)) {if(x = TRUE) {1} else if(x = FALSE) {0}

但我无法进一步使用它来创建一个新列。

4

2 回答 2

11

你多虑了。TRUE并且FALSE可以1强制0使用as.numeric.

mydf$Temp > 70
# [1] FALSE  TRUE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE FALSE FALSE FALSE FALSE
as.numeric(mydf$Temp > 70)
# [1] 0 1 1 0 0 0 0 0 0 0 1 0 0 0 0

因此,要创建新列,您只需执行以下操作:

mydf$TempBin <- as.numeric(mydf$Temp > 70)
mydf
#    Ozone Solar.R Wind Temp Month Day TempBin
# 1     41     190  7.4   67     5   1       0
# 2     36     118  8.0   72     5   2       1
# 3     12     149 12.6   74     5   3       1
# 4     18     313 11.5   62     5   4       0
# 5     NA      NA 14.3   56     5   5       0
# 6     28      NA 14.9   66     5   6       0
# 7     23     299  8.6   65     5   7       0
# 8     19      99 13.8   59     5   8       0
# 9      8      19 20.1   61     5   9       0
# 10    NA     194  8.6   69     5  10       0
# 11     7      NA  6.9   74     5  11       1
# 12    16     256  9.7   69     5  12       0
# 13    11     290  9.2   66     5  13       0
# 14    14     274 10.9   68     5  14       0
# 15    18      65 13.2   58     5  15       0
于 2013-11-14T05:13:22.850 回答
11

您还可以使用ifelsewhich is vectorized if-else 函数

mydata$NewTemp <- ifelse(mydata$Temp>0, 1, 0)
于 2013-11-14T05:16:21.860 回答