r - 在 R 中执行 4 循环（？）方差分析

Question

我正在对植被进行光谱分析，并正在研究哪个是最重要的波长，以便进行一些遥感。

但是，我有 2000 个波长，因此我需要找到一种快速运行 ANOVA 的方法，并且我已经阅读了 4 个循环（或只是循环），这意味着我可以更快地进行此操作，而不必单独执行每个循环。

目前我的R代码是：

mod_structure1 <- lm(X350 ~ structure, data=mydata)   
mod_structure1
summary(mod_structure1)
boxplot(X350 ~ structure, data=mydata, xlab="blah", ylab="350nm")
anova(mod_structure1)

X350的波长为350nm。

我真的很感激一些帮助——我的 R 知识不是很好，如果这真的没有意义，我深表歉意。

score 0 · Accepted Answer

lapply比 for 循环更快，并且执行相同的技巧：

首先定义一个带有波长名称的向量。准确地做到这一点很困难，因为您没有包含示例数据。

wavs <- c("X350", "X...", "X...",...)

由于您有这么多波长，您可能不想手动执行此操作。包括您的数据示例，因此更容易提供建议，但假设您将它们作为数据框的列（从 X350 猜测）：

require(reshape2)
wavdata <- melt(mydata, id = "structure")
wavs <- levels(wavdata$variable)

然后你可以继续循环：

mods <- lapply(wavs, function(i) {
x <- subset(wavdata, variable == wavs)
mod_structure1 <- lm(variable ~ value, data=x)
anova(mod_structure1)})

这为您提供了令人难以置信的 ANOVA 列表，因此请做好准备。将相关参数从这些 ANOVA 获取到 data.frame 可能会更好，这样更容易处理。

mod.data <- lapply(wavs, function(i) {
x <- subset(wavdata, variable == wavs)
mod_structure1 <- lm(variable ~ value, data=x)
tmp <- anova(mod_structure1)
data.frame(Df = tmp$Df[[1]], F = tmp$F[[1]], p = tmp$P[[1]])
})

do.call(rbind, mod.data)

该代码未经测试，可能包含错误。但是，您可以根据其背后的想法生成自己的想法。

r - 在 R 中执行 4 循环（？）方差分析

1 回答 1

Related

Reference