1

我试图理解灵活的判别函数分析,特别是 R 中“mda”包中的“fda”命令。我的理解是默认方法是简单的线性判别函数分析,我可以了解我的哪一个使用以下代码(来自文档中的示例),原始预测变量对每个判别式的贡献最大:

data(iris)
irisfit <- fda(Species ~ ., data = iris)
coef(irisfit)
               [,1]        [,2]
Intercept    -2.1264786 -6.72910343
Sepal.Length -0.8377979  0.02434685
Sepal.Width  -1.5500519  2.18649663
Petal.Length  2.2235596 -0.94138258
Petal.Width   2.8389936  2.86801283

我的理解是,从上面我们可以将 Petal.Width 解释为对 DF1 的组区分的贡献最大(尽管在此示例中其他变量具有类似的区分)。

现在,当方法设置为 mars 时(例如,使用灵活的判别函数分析时),我试图获得类似的系数。

irisfit <- fda(Species ~ ., data = iris,method=mars)
coef(irisfit)
      [,1]      [,2]
[1,]  7.0488114 -2.107810
[2,] -1.6956574  5.520759
[3,] -4.6872316  2.640739
[4,] -2.7177875 -3.155109
[5,]  3.0196475 -2.095824
[6,] -0.9007739 -2.515975
[7,] -0.6596193 -1.423301

请原谅我对该方法的有限理解,但我不清楚这里返回的内容/如何解释这些值(例如,有七行但只有四个初始变量……系数现在还包括非线性吗?模型中的术语?)。我无法从 Hastie 等人中弄清楚这一点。纸...

另外,我应该解释一下,我进行分析的主要动机不是结果分类,而是要了解在给定该分类的情况下哪些变量具有最大的区分能力。我正在探索其他方法,但认为 fda 可能有用......

提前致谢!

4

0 回答 0