“linear-discriminant”的相关标签问题

0 投票

1 回答

2940 浏览

r - 如何绘制 MASS:qda 分数

从这个问题，我想知道是否可以提取二次判别分析（QDA）分数并在像 PCA 分数之后重用它们。

在此处使用 QDA

在这里，您可以看到它不起作用。

r quadratic linear-discriminant

2016-10-03T23:46:11.913

0 投票

1 回答

9566 浏览

r - LDA 解释

我使用 HMeasure 包将 LDA 纳入我的信用风险分析中。我有 11000 个 obs，我选择了年龄和收入来进行分析。我不确切知道如何解释 LDA 的 R 结果。所以，我不知道我是否根据信用风险选择了最佳变量。我在代码下方向您展示。

其中 ETA = AGE 和 STIPENDIO = INCOME

非常感谢！

r lda risk-analysis linear-discriminant

2016-10-17T13:15:59.307

0 投票

1 回答

919 浏览

r - 如何在 R 中绘制 Fisher LDA 的决策边界？

我是 R 的新手，我一直在尝试创建 Fisher LDA，但我很难在 R 中解决向量和指标。如果有人能告诉我我做得对吗，因为当我遇到这个错误时尝试绘制决策边界

当我删除 xlim 和 ylim 我得到这个

如果我将 xlim 和 ylim 设置为数字，我会得到一个空图。

这是我的代码

r machine-learning data-science linear-discriminant

2016-11-19T02:55:55.063

0 投票

1 回答

522 浏览

matlab - 什么样的 LDA 执行“fitcdiscr”功能？

我知道新的fitcdiscrMATLAB® 函数可以执行多种判别分析，例如 LDA 或 QDA。但是，MATLAB® 中提到的“正则化”和“贝叶斯”让我感到困惑。

fitcdiscr如果使用默认参数，执行什么样的判别分析？它使用贝叶斯线性判别分析 (BLDA)、Fisher's LDA (FLDA) 还是某种正则化 LDA (rLDA)？

matlab machine-learning classification lda linear-discriminant

2016-12-20T11:48:56.570

0 投票

2 回答

574 浏览

r - 可以通过特定概率强制逻辑回归或其他分类器吗？

我有一个包含二进制变量[Yes/No] 和连续变量 (X) 的数据集。我正在尝试制作一个模型来对 [Yes/No] X 进行分类。

从我的数据集中，当 X = 0.5 时，48% 的观察结果是肯定的。但是，我知道当 X = 0.5 时，Yes 的真实概率应该是 50%。当我使用逻辑回归 X = 0.5 != P[Yes=0.5] 创建模型时。

我该如何纠正？我想如果它没有通过正确的点，那么所有的概率都应该被略微低估。

只是在我的样本中添加一堆观察值来调整比例是否正确？

不必只是逻辑回归，LDA、QDA 等也很有趣。

我搜索了 Stack Overflow，但只找到了有关线性回归的主题。

r logistic-regression spss linear-discriminant

2016-12-28T21:57:04.887

0 投票

0 回答

279 浏览

python - 对于 LinearDiscriminantAnalysis，当 shrinkage=true 时发生 MemoryError

除了设置收缩参数之外，该算法的其余场景运行良好。
为了提高算法的准确性，我使用了各种技术。
在 scikit 文档中，它说使用收缩可以提高准确性。

我正在使用 scikit-learn ( fetch_olivetti_faces) 提供的 AT&T 数据集。

是因为特征数量大还是内存问题？

目前我正在使用VM机器来运行代码。
机器硬件规格如下：

CPU：Core i5
内存：1 GB Ram
存储：20 GB SSD
操作系统：UBUNTU 14.4

这是我正在运行的代码：

这是我得到的错误：

python machine-learning scikit-learn face-recognition linear-discriminant

2017-01-03T10:56:30.770

0 投票

0 回答

973 浏览

python - Python sklearn中的典型判别函数

我正在学习线性判别分析并使用 scikit-learn 模块。我对LinearDiscriminantAnalysis类的“coef_”属性感到困惑。据我了解，这些是判别函数系数（sklearn 称它们为权重向量）。由于应该有 (n_classes-1) 个判别函数，我希望 coef_ 属性是一个形状为 (n_components, n_features) 的数组，但它会打印一个 (n_classes, n_features) 数组。下面是使用 sklearn 中的 Iris 数据集示例的示例。由于有 3 个类和 2 个组件，我希望 print(lda.coef_) 给我一个 2x4 数组而不是 3x4 数组...

也许我误解了权重向量是什么，也许它们是分类函数的系数？

以及如何获得每个判别/规范函数中每个变量的系数？

jupyter笔记本截图

代码在这里：

python statistics scikit-learn pca linear-discriminant

2017-02-03T20:47:24.737

0 投票

0 回答

212 浏览

machine-learning - 我的半监督线性判别分析根本不起作用

我正在研究 LDA（线性判别分析），您可以参考http://www.ccs.neu.edu/home/vip/teach/MLcourse/5_features_dimensions/lecture_notes/LDA/LDA.pdf。

我对半监督 LDA 的想法：我可以使用标记数据 $X\in R^{d\times N}$ 来计算 $S_w$ 和 $S_b$ 中的所有项。现在，我还有未标记的数据 $Y\in R^{d\times M}$，并且这些数据可以额外用于估计 $S_w$ 中的协方差矩阵 $XX^T$ 通过 $\frac{N}{ N+M}(XX^T+YY^T)$ 直观地得到更好的协方差估计。

不同 LDA 的实现：我还为所有比较的方法在 $S_w$ 中添加了一个缩放的单位矩阵，缩放参数应该在不同的方法中调整。我将训练数据分为两部分：标记为 $X\in R^{d\times N}$，未标记为 $Y\in R^{d\times M}$，$N/M$ 的范围从 $0.5$ 到 $0.05$ . 我在三种真实数据集上运行我的半监督 LDA。

分类方法：将$S_w^{-1}S_b$的特征向量作为变换矩阵$\Phi$，则

实验结果： 1）在测试数据中，我在数据$X$&$Y$上训练的半监督LDA的分类准确率总是比只在数据$X$上训练的标准LDA差一点。2）此外，在一个真实数据中，这两种方法的最佳缩放参数可能非常不同，以实现最佳分类精度。

你能告诉我原因并给我建议让我的半监督 LDA 工作吗？我的代码已经过检查。非常感谢。

machine-learning classification data-mining static-methods linear-discriminant

2017-02-09T15:36:03.870

0 投票

1 回答

374 浏览

r - 无论错误如何，R 控制台都会提供输出，但 Shiny 应用程序不会因为错误而输出。如何绕过 Shiny 应用程序中的错误？

当我在 R 控制台中运行以下代码时，我在第 10 行收到以下错误：

“lda.default(x, grouping, ...) 中的错误：变量 5 6 在组内似乎是常数”

然而，其余的代码仍然被处理并绘制了数据。但是当我将此代码集成到我闪亮的应用程序中时，绘图面板会显示错误消息而没有其他内容。

有没有办法解决这个问题？

输入：

控制台输出：

r shiny lda data-science linear-discriminant

2017-02-10T15:54:27.520

0 投票

1 回答

773 浏览

r - 比较测试性能

我正在尝试在这里处理一些数据并比较 glm 和 lda 的测试性能。

数据附在此处。

这是我尝试做这两个的总体计划：

然而这些都不起作用。我以为有一个多项式家庭课程，但似乎不存在。另外，由于我的第一列是数字，而下一列都是灰度值，我认为我这样做V1 ~ .了，但我认为这对于这些情况也不正确。有人知道我的语法/设置是否错误吗？

编辑：我添加了我如何尝试计算 LDA 的分类错误。但是我不认为我原来的东西有效，因为它给出了：

(pred_lda) 中的错误 - test$V1：二元运算符的非数字参数

r machine-learning logistic-regression linear-discriminant

2017-02-16T06:27:30.513

问题标签 [linear-discriminant]

Reference