问题标签 [pearson-correlation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
performance - 高效的列相关系数计算
原始问题
我将大小为 n 的行 P 与大小为 n×m 的矩阵 O 的每一列相关联。我制作了以下代码:
它比天真的方法更有效:
以下是我在英特尔内核上使用 numpy-1.7.1-MKL 获得的时间:
现在的问题是:你能为这个问题推荐一个更快的代码版本吗?挤出额外的 20% 会很棒。
2017 年 5 月更新
很长一段时间后,我回到了这个问题,重新运行并扩展了任务和测试。
使用 einsum,我将代码扩展到 P 不是行而是矩阵的情况。因此,任务是将 O 的所有列与 P 的所有列相关联。
对如何用科学计算常用的不同语言解决相同的问题感到好奇,我在 MATLAB、Julia 和 R 中实现了它(在其他人的帮助下)。MATLAB 和 Julia 是最快的,它们有专门的例程计算列相关性。R 也有专门的例程,但速度最慢。
在当前版本的 numpy(来自 Anaconda 的 1.12.1)中,einsum 仍然胜过我使用的专用函数。
所有脚本和时间都可以在https://github.com/ikizhvatov/efficient-columnwise-correlation获得。
c# - 如何计算 2 个给定向量之间的 Pearson 相关性?
我必须用 C# 编写代码
你能在下面给出的例子中一步一步地解释吗?
很Ty
这将用于文档聚类
r - 不同大小向量之间的相关矩阵
我正在尝试为不平衡数据实现相关矩阵,这可能吗?我下面的代码显示了我一直在尝试做的事情。有人可以帮我解决这个问题吗?
我的代码
变量
相关矩阵函数
不工作
谢谢
recommendation-engine - 向员工推荐工作的推荐算法(众包平台)
我已经爬过 MTurk 网站。我有 260 个 Hits 作为数据集,并且从该数据集中,特定数量的用户选择了 Hits 并为每个选定的 Hits 分配了评级。现在我想根据他们的选择向这些用户推荐。怎么可能?谁能推荐我任何推荐算法?
hadoop - 为什么这个例子会导致 NaN?
我正在查看Statistics.corr
PySpark 中的文档:https ://spark.apache.org/docs/1.1.0/api/python/pyspark.mllib.stat.Statistics-class.html#corr 。
为什么这里的相关性会导致NaN
?
c# - 性能数组乘法 Pearson
我多次计算Pearson 相关性(平均用户/项目评级),使用我当前的代码性能非常糟糕:
我正在使用标准的 Pearson 相关性MathNet.Numerics
,但这是对标准的修改,无法使用它。有没有办法加快速度?如何优化时间复杂度?
machine-learning - 协同过滤 - 矩阵分解与皮尔逊相关
对于推荐引擎,这些技术的优点和缺点是什么(矩阵分解:ALS、pearson 或 cossin 相关性)以及我们如何决定使用哪种技术。
python - 在 python 中运行 pearson 相关分数时出错
我是 python (PYTHON 2.7) 的新手,我正在尝试运行一个计算 Pearson 相关性的程序。代码来自“集体智慧”当我导入函数并运行 Pearson 的相关性时
我收到此错误:
代码在这里
python - 使用 Pearson 相关性和线性回归与 python 进行简单预测
我有一个这样的数据集
value 是一个地区的年降雨量。让我们称之为A区。我有 2006 年到 2014 年的数据集,我需要预测 A 区未来 2 年的降雨量。我从 sklearn 库中选择 pearson 相关和线性回归来预测数据。我很困惑,我不知道如何设置 X 和 Y。我是 Python 新手,所以每一个帮助都很有价值。谢谢
ps ..我找到了这样的代码
当我打印diabetes_X_train时,它给了我这个
我假设这是从相关性和系数中获得的 r 值。当我打印diabetes_Y_train时,它给了我这样的东西
我的问题是如何从降雨中获取 r 值并将其分配给 x 轴