问题标签 [pearson]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
7832 浏览

matlab - 如何在 Matlab 中获得皮尔逊与矩阵的相关性

我有一些向量,例如,我们称它们为 a、b 和 c。它们都具有相同的尺寸。我想得到a和c,b和c之间的相关性。

我试过了:

[rho1,pval1]=corr(a,c,'rows','complete')
[rho2,pval2]=corr(b,c,'rows','complete')


rho1=0.1054
pval1=0.2918
rho2=0.1174
pval2=0.2473


而且我认为结果还可以,但是后来我尝试了:
[rho,pval]=corr([ab],c,'rows','complete')

并给了我不同的结果:


ρ=
0.1168
0.1150

pval=
0.2649
0.2726


Matlab 的帮助说这些函数返回一个 p1-by-p2 矩阵,其中包含 n-by-p1 和 n-by-p2 矩阵 X 和 Y 中每对列之间的成对相关系数。

我究竟做错了什么?谢谢。

注意:向量是 289x1,所以我不能在这里写。

0 投票
1 回答
2977 浏览

correlation - 根据 tf-idf 值计算相关性?

根据 tf-idf 矩阵计算 pearson 相关系数以查看哪些项与其他项结合出现是否有意义?它在数学上正确吗?

我的输出是一个相关矩阵,每个单元格中每个术语都有相关系数。

  • --------term1 term2 term3
  • 学期2
  • 学期2
  • 学期2
0 投票
1 回答
1193 浏览

data-visualization - 如何在给定时间序列的情况下绘制 Pearson 相关性?

我正在使用本网站http://blog.chrislowis.co.uk/2008/11/24/ruby-gsl-pearson.html中的代码来实现 Pearson Correlation 给定两个时间序列数据,如下所示:

这将返回一个数字,例如 -0.2352461593569471。

我目前正在使用 highcharts 库并为其提供两组时间序列数据。鉴于我对这两个集合都有一个有限的时间序列,我可以用这个数字(-0.2352461593569471)做一些事情来创建第三个时间序列来显示这条曲线的斜率吗?如果有人能指出我正确的方向,我将不胜感激!

0 投票
1 回答
3899 浏览

r - 在推荐系统的皮尔逊相关用户-用户相似度矩阵中,NaN 是如何处理的?

我正在从用户评分数据(特别是 MovieLens100K 数据)生成用户-用户相似度矩阵。计算相关性会导致一些 NaN 值。我在一个较小的数据集中进行了测试:

用户项目评分矩阵

用户-用户皮尔逊相关相似度矩阵

为了计算 pearson 相关性,仅考虑两个用户之间的关联项目。(参见迈向下一代推荐系统:最新技术和可能扩展的调查,Gediminas Adomavicius,Alexander Tuzhilin

我如何处理 NaN 值?

编辑 这是我在 R 中找到 pearson 相关性的代码。R矩阵是用户项目评级矩阵。包含 1 到 5 级评分 0 表示未评分。S是用户-用户相关矩阵。

请注意,在该S[i,k] <- ifelse (is.nan (temp), 0, temp)行中,我将NaNs 替换为 0。

0 投票
1 回答
608 浏览

correlation - 第一和第三变量之间的相关性

假设我们有 x 和 y as之间的corr(x,y)相关性以及 y 和 z as 之间的相关性corr(y,z)。关于 x 和 z ie 之间的相关性可以说什么corr(x,z)

感谢您的阅读。

0 投票
6 回答
502 浏览

c++ - 显示最大和最小数字时出错

我试图为 How to Program 中的练习 2.19 编写一个程序,但遇到了一些困难。

该程序应该让用户输入三个整数,然后显示这些整数的sumaverageproduct

我遇到的唯一问题是显示最大和最小。当我运行程序并输入三个整数(8, 9, and 10)时,输出为Smallest is 8 AND Smallest is 9.

我希望你能告诉我为什么。

PS我这样做是为了学习,这不是家庭作业。

0 投票
1 回答
58 浏览

c++ - 计数器变量错误?

我有一个关于此编码中的故障的快速问题。

当我运行这个程序并进入这个循环时(通过输入 1 作为数字),一切都很顺利,除了即使我进入++generalcounter1;了循环体,它似乎并不是每次都在这个变量中添加一个循环播放。当变量 == 10 时,它永远不会运行它应该运行的消息。

请帮助我,我很沮丧!非常感谢您的建议!

抱歉,如果不清楚,我对这个网站以及编程都是新手。

0 投票
2 回答
300 浏览

c++ - 理解 C++ 中的浮点变量和运算符(也可能是书本错误)

我正在学习一个开始的 C++ 类,而我的书(Starting Out with C++ Early Objects 7th edition)有一个非常糟糕的例子来说明如何检查浮点变量的值。

有问题的书籍示例(文件名 pr4-04.cpp):

我在 Ubuntu 中使用 g++ 来编译我的代码,如下所示:

我得到这个错误:

我可以通过将 abs() 更改为 fabs() 来解决这个问题,但这仍然非常令人困惑!为什么这本书给了我们无法编译的东西,或者这只是我?为什么“结果”的 cout 给出 4 而不是 4.000002?为什么这个值在 if{} 语句中使用时似乎会发生变化?

我知道我们不能只使用 == 来检查等价,但是为什么我需要使用绝对值呢?无论我是否使用它,我都会得到相同的答案。那么有什么意义呢?

更不用说,这似乎是检查浮点等价的一种非常糟糕的方法。有一个更好的方法吗?这个话题似乎非常重要

我在stackoverflow上找到了这个主题,但是他们的解决方案:

就我的 4 章 C++ 经验而言,这对我来说没有多大意义。我将不胜感激一些帮助。我们的书给了我多达 6 句话来解释这一切。

编辑:根据一些人的建议,我试图找到一个勘误页面,但是在搜索教科书、互联网和我的课程网站 30 分钟后,我只能找到这个需要登录的可下载 zip 文件-_-

我也完美地复制了代码。那不是的错字,我直接从带有代码的 CD 上复制了它。书中也是这样打的。

0 投票
2 回答
777 浏览

python - Programming Collective Intelligence 中的 Pearson 算法仍然无法正常工作

我运行代码来计算皮尔逊相关系数,并且函数(粘贴在下面)顽固地返回 0。

根据之前关于这个问题的建议(参见下面的#1、#2),我确实确保该函数能够执行浮点计算,但这并没有帮助。我会很感激这方面的一些指导。

我的数据集:

其他类似问题:

0 投票
1 回答
195 浏览

matlab - 在枚举类型数据中查找相关性

我有以下数据集,其中包含有关国家/地区的信息

每行的第六列表示该国的主要宗教:0 是天主教,1 是其他基督教,2 是穆斯林,等等。其他一些数据是关于它们所包含的国家符号的国旗中是否存在不同的颜色, 等等。

数据的描述可以在这里找到。我已经删除了字符串数据列,所以它与显示的信息不完全一样。

我的问题是,我想使用协方差矩阵和皮尔逊相关性来查看,例如,旗帜中带有红色的事实是否可以说明该国的宗教是否有更大的机会成为某种东西比别的东西。但是由于列举了宗教,我对如何解决这个问题有点迷茫。