0

我正在对植被进行光谱分析,并正在研究哪个是最重要的波长,以便进行一些遥感。

但是,我有 2000 个波长,因此我需要找到一种快速运行 ANOVA 的方法,并且我已经阅读了 4 个循环(或只是循环),这意味着我可以更快地进行此操作,而不必单独执行每个循环。

目前我的R代码是:

mod_structure1 <- lm(X350 ~ structure, data=mydata)   
mod_structure1
summary(mod_structure1)
boxplot(X350 ~ structure, data=mydata, xlab="blah", ylab="350nm")
anova(mod_structure1)

X350的波长为350nm。

我真的很感激一些帮助——我的 R 知识不是很好,如果这真的没有意义,我深表歉意。

4

1 回答 1

0

lapply比 for 循环更快,并且执行相同的技巧:

首先定义一个带有波长名称的向量。准确地做到这一点很困难,因为您没有包含示例数据。

wavs <- c("X350", "X...", "X...",...)

由于您有这么多波长,您可能不想手动执行此操作。包括您的数据示例,因此更容易提供建议,但假设您将它们作为数据框的列(从 X350 猜测):

require(reshape2)
wavdata <- melt(mydata, id = "structure")
wavs <- levels(wavdata$variable)

然后你可以继续循环:

mods <- lapply(wavs, function(i) {
x <- subset(wavdata, variable == wavs)
mod_structure1 <- lm(variable ~ value, data=x)
anova(mod_structure1)})

这为您提供了令人难以置信的 ANOVA 列表,因此请做好准备。将相关参数从这些 ANOVA 获取到 data.frame 可能会更好,这样更容易处理。

mod.data <- lapply(wavs, function(i) {
x <- subset(wavdata, variable == wavs)
mod_structure1 <- lm(variable ~ value, data=x)
tmp <- anova(mod_structure1)
data.frame(Df = tmp$Df[[1]], F = tmp$F[[1]], p = tmp$P[[1]])
})

do.call(rbind, mod.data)

该代码未经测试,可能包含错误。但是,您可以根据其背后的想法生成自己的想法。

于 2014-02-04T10:44:26.537 回答