目前我正在学习 QDA 并正在使用 R 软件来分析我的数据。
数据是从以下链接下载的:
https://www.kaggle.com/uciml/pima-indians-diabetes-database
我想检查 QDA 假设,即两组是多元正态分布的,因此在 R 中使用了以下命令。
library(MVN)
group1 <- discrim[1:500, 1:8]
result<- mardiaTest(group1, qqplot = FALSE) #To check whether our data from group1 is MND
group2 <- discrim[501:765, 1:8]
result2 <- mardiaTest(group2, qqplot= TRUE)#To check whether our data from group2 is MND
两组都是非正态分布的,所以我想对数据进行归一化,并编写下面的代码来归一化第一组的数据。
x1bar <- t(t(as.vector(sapply(as.data.frame(group1),mean))))
x1bartilda<- (x1bar - mean(x1bar))/sd(x1bar)
与 group2 类似,但是 group1 的平均向量 X 没有给出接近 0 的结果。
谁能帮助我前进的方向是什么?