我有一个连续变量,带有一些“NA”,并且由于某种原因,当我尝试查看变量(即平均摘要)时,会出现以下情况:
Summary(THM1$Br03)
Length Class Mode
0 NULL NULL
mean(THM$Br03)
[1] NA
这是查看前几行时的输出:
WSZ_Code Treatment_Code Year Month TTHM CL2_FREE BrO3 Colour PH TURB
1 2 3 1996 1 30.7 0.350 0.00030 0.75 7.40 0.055
3 7 4 1996 2 60.4 0.050 0.00055 0.75 7.10 0.055
4 7 4 1996 2 58.1 0.150 NA 0.75 7.50 0.055
但是当我做str(THM)时:
'data.frame': 345 obs. of 10 variables:
$ WSZ_Code : int 2 6 7 7 7 5 1 5 8 1 ...
$ Treatment_Code: int 3 1 4 4 4 2 2 2 1 2 ...
$ Year : int 1996 1996 1996 1996 1996 1996 1996 1996 1996 1996 ...
$ Month : int 1 2 2 2 3 3 3 3 3 3 ...
$ TTHM : num 30.7 24.8 60.4 58.1 62.2 40.3 20.8 36.3 40.5 47.8 ...
$ CL2_FREE : num 0.35 0.25 0.05 0.15 0.2 0.15 0.15 0.025 0.25 0.05 ...
$ BrO3 : num 0.0003 0.00055 0.00055 NA NA 0.0014 NA NA NA NA ...
好的,所以你可以看到前几个值,然后是它的 NA,但我无法总结该变量中的任何数据!我只需要对数据进行一些汇总统计并查看 Br03 和 TTHM 之间的关系
当我尝试这个时:
mean(THM$Br03, na.rm=TRUE)
[1] NA
Warning message:
In mean.default(THM$Br03, na.rm = TRUE) :
argument is not numeric or logical: returning NA
这就是发生的事情。
我不知道如何将变量重新编码为 0 或 99 以便分析变量。