问题标签 [mahalanobis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
25 浏览

r - 摘要输出对于控制台查看来说太大(R)

我最近在 R 中使用 MatchIt 来匹配两个公司样本。我使用了 Mahalanobis 和精确匹配的组合,根据公司在特定年份的活动进行匹配。

使用 lapply(m_years, summary) 我可以调出这个过程的摘要,但是我在控制台中查看所有相关摘要信息太长了,因为每年都有不匹配和匹配数据的摘要。

反正有没有在其他地方完整地打开摘要?我很想看到每年的摘要,这样我就可以检查匹配过程的有效性并将信息整理到表格中。

我尝试使用

ETC....

...但这是查看更改的无效方式。

任何提示表示赞赏!

0 投票
1 回答
42 浏览

r - 如何在我的 MatchIt 代码中为配对/组创建唯一的 MatchID?

作为硕士论文研究的一部分,我已经在 R 中实现了 MatchIt 包。该准则目前将一些可持续投资公司与非可持续投资公司的比例为 1:2。

我需要修改我的代码,以便匹配项具有匹配 ID。目前代码运行良好且匹配正确,但我不知道哪些公司与哪些控件配对。

任何人都可以提出修改建议吗?

我没有包含我的所有代码,因为我认为这太过分了,但匹配步骤的主要内容如下:

任何建议都会非常受欢迎!

罗里

0 投票
0 回答
36 浏览

python - 使用 Mahalanobis 在最近邻居中的错误

当 algorithm=brute 时,来自 sklearn.neighbors 的 NearestNeighbors 类不能正确处理 V 矩阵。V 矩阵似乎被忽略了。

现在我们创建一些数据并说明问题。

如果 V 不同,结果应该会改变。它适用于 algorithm=auto 但不适用于 brute

实际结果

我该如何解决这个问题?

0 投票
1 回答
46 浏览

java - 仅使用 org.apache.commons.math3 计算马氏距离

有没有办法计算马氏距离省略org.apache.mahout使用(仅使用org.apache.commons.math3)?

0 投票
0 回答
28 浏览

python - 如何在协方差较弱的多元数据中找出异常值

我使用 PCA 和 Mahalanobis 距离来查找异常值。但在这两种情况下,只有最高或最低值被检测为异常值。我正在寻找一种方法,可以将不遵循输出和 3 个输入之间某种相关性的任何数据点识别为异常值。

0 投票
1 回答
71 浏览

python - 主成分分析后的马氏距离不等于欧几里得距离

我试图将马氏距离计算为使用 PCA 转换后的欧几里得距离,但是,我没有得到相同的结果。以下代码:

印刷

据我了解,PCA 与维度无关,除以标准差对每个维度的权重均等,因此欧几里德距离应等于马氏距离。我哪里错了?

0 投票
1 回答
72 浏览

r - 如何使用 Mahalanobis 距离在 R 中找到 K 最近邻

我有一个从 1970 年到 2020 年的时间序列数据集作为我的训练数据集,并且我有另一个对 2021 年的观察,我现在要做的是使用马氏距离来识别训练数据集中 2021 年的 10 个最近邻。我尝试了几个函数,例如get.knn()and get.knnx(),但我未能将距离设置为马氏距离。有什么我可以使用的功能吗?先感谢您!

- - - - - - - - - 编辑 - - - - - - - - - -

所以我尝试了函数,mahalanobis()然后我得到了一个值列表,这些值是马氏距离吗?我可以对它们进行排序以获得前 10 名吗?

0 投票
0 回答
88 浏览

python - 具有马氏距离的 Sklearn NearestNeighbors 返回数组切片的错误

以下代码返回错误:

返回以下错误:

我不确定错误消息的含义,因为我没有在任何地方传递 Y。此外,如果我在最后一行更改X[:1,:]X,则代码运行良好,但出于速度原因,我不想在整个输入数组上运行它。