我想评估由多元正态密度产生的数据点。我必须针对不同的均值和协方差矩阵评估每个数据点。对于每个观察,我有两种方法来评估可能性。此外,我总体上有两个不同的方差协方差矩阵。目前,我只考虑二维正态分布。
基本上,我必须做很多多变量可能性评估,我正在寻找一种方法来更快地做到这一点。这是一些示例代码(以下数据):
N <- 10 #number of observations
G <- 2 #number of means per observation / variance - covariance matrices
ll <- array(NA, c(N,G)) #shell for the log likelihoods
for(ii in 1:N){ #loop over data-points
for(gg in 1:G){ #loop over groups of means / var-cov matrices
ll[ii,gg] <- mixtools::logdmvnorm(data[ii,], #evaluate data by observation
mu = means[[gg]][ii,], #mean by group by obs.
sigma = Sigma[[gg]]) #var-cov matrix by group
}
}
我想要做的是以下内容:获取第一个数据点,使用来自观察 1 的均值 A 和协方差矩阵 A 对其进行评估。使用来自观察 1 和协方差矩阵 B 的均值 B 对其进行评估。获取第二个数据点,评估它相对于属于观察 2/协方差矩阵 A 的均值 A。然后使用来自观察 2/协方差矩阵 B 的均值 B 对其进行评估,依此类推。
我在这里准备了 10 个数据点以及 10*2 平均向量和 2 个方差协方差矩阵。不必保留列表结构,它只是在编码过程中自然产生的。
在单变量设置中,可以通过使用 dnorm() 是矢量化的事实来获得足够快的性能。因此,在这种情况下不需要 N 次迭代。
谢谢!