我试图理解灵活的判别函数分析,特别是 R 中“mda”包中的“fda”命令。我的理解是默认方法是简单的线性判别函数分析,我可以了解我的哪一个使用以下代码(来自文档中的示例),原始预测变量对每个判别式的贡献最大:
data(iris)
irisfit <- fda(Species ~ ., data = iris)
coef(irisfit)
[,1] [,2]
Intercept -2.1264786 -6.72910343
Sepal.Length -0.8377979 0.02434685
Sepal.Width -1.5500519 2.18649663
Petal.Length 2.2235596 -0.94138258
Petal.Width 2.8389936 2.86801283
我的理解是,从上面我们可以将 Petal.Width 解释为对 DF1 的组区分的贡献最大(尽管在此示例中其他变量具有类似的区分)。
现在,当方法设置为 mars 时(例如,使用灵活的判别函数分析时),我试图获得类似的系数。
irisfit <- fda(Species ~ ., data = iris,method=mars)
coef(irisfit)
[,1] [,2]
[1,] 7.0488114 -2.107810
[2,] -1.6956574 5.520759
[3,] -4.6872316 2.640739
[4,] -2.7177875 -3.155109
[5,] 3.0196475 -2.095824
[6,] -0.9007739 -2.515975
[7,] -0.6596193 -1.423301
请原谅我对该方法的有限理解,但我不清楚这里返回的内容/如何解释这些值(例如,有七行但只有四个初始变量……系数现在还包括非线性吗?模型中的术语?)。我无法从 Hastie 等人中弄清楚这一点。纸...
另外,我应该解释一下,我进行分析的主要动机不是结果分类,而是要了解在给定该分类的情况下哪些变量具有最大的区分能力。我正在探索其他方法,但认为 fda 可能有用......
提前致谢!