我的数据集中有几个变量代表一周内事件的每日时间。
例如,两行可能如下所示:
t1 = c(NA,12.6,10.7,11.5,12.5,9.5,14.1)
t2 = c(23.7,1.2,NA,22.9,23.2,0.5,0.1)
我想计算这些行的方差。为此,我需要平均值,并且因为这些是周期性变量,所以我调整了此页面中的代码:
#This can all be wrapped in a function like this
circ.mean <- function(m,int,na.rm=T) {
if(na.rm) m <- m[!is.na(m)]
rad.m = m*(360/int)*(pi/180)
mean.cos = mean(cos(rad.m))
mean.sin = mean(sin(rad.m))
x.deg = atan(mean.sin/mean.cos)*(180/pi)
return(x.deg/(360/int))
}
这可以按预期工作t2
:
> circ.mean(t2,24)
[1] -0.06803088
虽然理想的答案是23.93197
。但是对于t1
,它给出了一个错误的答案:
> circ.mean(t1,24)
[1] -0.1810074
而使用普通mean
函数给出正确答案:
> mean(t1,na.rm=T)
[1] 11.81667
我的问题是:
1)这个“循环平均值”代码是否正确,如果是,我是否正确使用它?
2)我有一个自己的circ.var
函数(见下文)来计算周期变量的方差 - 这会为所有可能的输入时序向量产生正确的方差吗?
circ.var <- function(m,int=NULL,na.rm=TRUE) {
if(is.null(int)) stop("Period parameter missing")
if(na.rm) m <- m[!is.na(m)]
if(sum(!is.na(m))==0) return(NA)
n=length(m)
mean.m = circ.mean(m,int)
var.m = 1/(n-1)*sum((((m-mean.m+(int/2))%%int)-(int/2))^2)
return(var.m)
}
任何帮助将不胜感激!感谢您抽时间阅读!