问题标签 [pearson-correlation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2036 浏览

performance - 高效的列相关系数计算

原始问题

我将大小为 n 的行 P 与大小为 n×m 的矩阵 O 的每一列相关联。我制作了以下代码:

它比天真的方法更有效:

以下是我在英特尔内核上使用 numpy-1.7.1-MKL 获得的时间:

现在的问题是:你能为这个问题推荐一个更快的代码版本吗?挤出额外的 20% 会很棒。

2017 年 5 月更新

很长一段时间后,我回到了这个问题,重新运行并扩展了任务和测试。

  1. 使用 einsum,我将代码扩展到 P 不是行而是矩阵的情况。因此,任务是将 O 的所有列与 P 的所有列相关联。

  2. 对如何用科学计算常用的不同语言解决相同的问题感到好奇,我在 MATLAB、Julia 和 R 中实现了它(在其他人的帮助下)。MATLAB 和 Julia 是最快的,它们有专门的例程计算列相关性。R 也有专门的例程,但速度最慢。

  3. 在当前版本的 numpy(来自 Anaconda 的 1.12.1)中,einsum 仍然胜过我使用的专用函数。

所有脚本和时间都可以在https://github.com/ikizhvatov/efficient-columnwise-correlation获得。

0 投票
1 回答
3372 浏览

c# - 如何计算 2 个给定向量之间的 Pearson 相关性?

我必须用 C# 编写代码

你能在下面给出的例子中一步一步地解释吗?

很Ty

这将用于文档聚类

0 投票
0 回答
201 浏览

r - 不同大小向量之间的相关矩阵

我正在尝试为不平衡数据实现相关矩阵,这可能吗?我下面的代码显示了我一直在尝试做的事情。有人可以帮我解决这个问题吗?

我的代码

变量

相关矩阵函数

不工作

谢谢

0 投票
1 回答
256 浏览

recommendation-engine - 向员工推荐工作的推荐算法(众包平台)

我已经爬过 MTurk 网站。我有 260 个 Hits 作为数据集,并且从该数据集中,特定数量的用户选择了 Hits 并为每个选定的 Hits 分配了评级。现在我想根据他们的选择向这些用户推荐。怎么可能?谁能推荐我任何推荐算法?

0 投票
1 回答
1275 浏览

hadoop - 为什么这个例子会导致 NaN?

我正在查看Statistics.corrPySpark 中的文档:https ://spark.apache.org/docs/1.1.0/api/python/pyspark.mllib.stat.Statistics-class.html#corr 。

为什么这里的相关性会导致NaN

0 投票
3 回答
86 浏览

c# - 性能数组乘法 Pearson

我多次计算Pearson 相关性(平均用户/项目评级),使用我当前的代码性能非常糟糕:

我正在使用标准的 Pearson 相关性MathNet.Numerics,但这是对标准的修改,无法使用它。有没有办法加快速度?如何优化时间复杂度?

0 投票
1 回答
1666 浏览

machine-learning - 协同过滤 - 矩阵分解与皮尔逊相关

对于推荐引擎,这些技术的优点和缺点是什么(矩阵分解:ALS、pearson 或 cossin 相关性)以及我们如何决定使用哪种技术。

0 投票
1 回答
197 浏览

python - 在 python 中运行 pearson 相关分数时出错

我是 python (PYTHON 2.7) 的新手,我正在尝试运行一个计算 Pearson 相关性的程序。代码来自“集体智慧”当我导入函数并运行 Pearson 的相关性时

我收到此错误:

代码在这里

0 投票
1 回答
558 浏览

mapreduce - map reduce - pearson 相关性

在此处输入图像描述

如何使用 map reduce 实现 pearson 相关性?

我考虑过映射每一对(x_i,y_i),但我不确定减少部分..

0 投票
1 回答
1987 浏览

python - 使用 Pearson 相关性和线性回归与 python 进行简单预测

我有一个这样的数据集

value 是一个地区的年降雨量。让我们称之为A区。我有 2006 年到 2014 年的数据集,我需要预测 A 区未来 2 年的降雨量。我从 sklearn 库中选择 pearson 相关和线性回归来预测数据。我很困惑,我不知道如何设置 X 和 Y。我是 Python 新手,所以每一个帮助都很有价值。谢谢

ps ..我找到了这样的代码

当我打印diabetes_X_train时,它给了我这个

我假设这是从相关性和系数中获得的 r 值。当我打印diabetes_Y_train时,它给了我这样的东西

我的问题是如何从降雨中获取 r 值并将其分配给 x 轴