问题标签 [pearson]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 来自 cor.test 的栅格相关性和 p 值
我正在尝试使用 和 获得两个光栅砖之间的像素相关性和显着性(p 值cor
)cor.test
。我的数据在这里:
它们都相当小,总共不到 2MB。
我从之前关于 StackOverflow 和 r-sig-geo 的讨论中找到了以下两个代码(均来自 Robert Hijmans):
两个代码都按预期工作,cor
函数产生相关网格。但是,我尝试用cor
with代替cor.test
以提取 p 值:
我遇到了以下错误(在 RStudio 中有引用):
在之前的 r-sig-geo 讨论中,用户曾询问过此错误,但没有得到答复。所以我再次询问并收到了对我的询问的回复,其中一位用户指出cor
能够输入矩阵并且cor.test
不能,但即使在将数据转换为数字向量之后:
我面临以下错误:
我想知道是否有人可以帮助解决这个问题?
我的 sessionInfo() 如下:
谢谢!
python - OpenCV 中可用的“matchTemplate”匹配方法的完整形式?
我知道这是一个菜鸟问题,但我不得不问。我对这些匹配方法matchtemplate ()
参数的完整形式感到困惑。
参数=['cv2.TM_CCOEFF','cv2.TM_CCOEFF_NORMED','cv2.TM_CCORR','cv2.TM_CCORR_NORMED','cv2.TM_SQDIFF','cv2.TM_SQDIFF_NORMED']
我想知道这种归一化互相关方法中的哪一种?是
**cv2.TM_CCOEFF_NORMED**
还是**cv2.TM_CCORR_NORMED**
。方法的完整形式是什么**cv2.TM_CCOEFF_NORMED**
。它是指“皮尔逊相关”还是“相关系数”?
normalization - 如何标准化 0 和 1 之间的 Pearson 相关性?
我遇到了 Pearson Correlation 的公式,但它给出的值介于 -1 和 1 之间。我将如何修改公式以使其给出介于 0 和 1 之间的值?
sparse-matrix - 稀疏和不平衡高维数据的特征选择
我有一个高度不平衡的数据,带有非常稀缺的正标签。数据是非常高维的。最重要的是,我的特征也非常稀疏。
那么在这种情况下进行特征选择的最佳方法是什么。任何基于 spearmann 或 pearson 相关性的相关性度量排名都不是一个好方法。因为我的大多数标签和特征都是零,而且看起来这个特征是高度相关的,或者即使它没有那么重要。
有什么建议吗?
frequency - 比较两个频谱
我正在尝试比较两个频谱,但我对很多点感到困惑。
一个设备以 40 Hz 采样,另一个以 100 Hz 采样,所以我不确定是否需要考虑到这一点。无论如何,我已经从这两种设备中产生了频谱,现在我想比较这些。如何在每个点上进行相关性,以便在每个点上获得皮尔逊相关性。我当然知道如何做一个整体的,但我想看到强相关性的点和不那么强的点?
recommendation-engine - 这是一种可行的用户项目推荐方法吗
我正在设计一个应用程序,它包含基于用户交互(协同过滤)的推荐系统。在他的主页上向用户展示了一组 6 个要与之交互的项目。将有 50 到 300 个项目。可以执行以下操作:
- 点击一个项目(强烈的兴趣)
- 刷新一个项目(一些兴趣)
- 打开一个阅读更多对话框(一些兴趣)
- 不要做任何事情(没有兴趣)
这些数据被收集和存储。系统应该向用户推荐感兴趣的项目。我正在考虑将这些数据转化为评级系统。
选项 A)如果用户点击一个项目,这将被转换为 5 的隐含生命周期评级。将项目刷新为 4,依此类推。所以我的 user->item 矩阵看起来像这样:
在这个例子中,john 点击了第 1 项并刷新了第 3 项。评级只能真正上升,即如果用户之前刷新过一个项目,我写一个 4,如果稍后单击该项目,则只更新为 5。
选项 B) 每次用户执行上述操作之一时,我都会为项目增加一个标量值,这意味着它可以无限增长。
也许这是个问题,因为现在这些数字更难转化为从 1 到 10 的等级量表
选项 C)我分别计算每次交互
这里的问题是“阅读”一个项目可能只完成一次。
与我选择的任何选项无关,我的想法是首先使用余弦相似度或皮尔逊相关性等方法找到相似的用户。然后从该列表中挑选前 10 到 30 名用户,并编制一份他们最喜欢的项目的顶级列表。然后,我将从该列表中推荐当前用户过去几乎没有互动过的项目。
这是可行的吗?我担心找到相似的用户会消除为当前用户找到有趣(新)项目的机会。
python - Python 中的皮尔逊相关性
我有一个关于 Pearson's Correlation 相似性用户的 python 代码,我想分析计算步骤,因为我是 Python 的初学者,呵呵。当我尝试手动计算并与该程序的结果进行比较时,结果总是不同。我想知道我在尝试手动计算时是否弄错了。代码是这样的:
我想计算用户 1 和用户 2 之间的相似度。但这部分我很困惑:
[它]是什么意思?
如果我使用这个程序,相似的结果是:0.755928946018
是真的这段代码的意思([prefs[p1][it] for it in si])
是乘以用户 1 的评级吗?喜欢1*2*4
?还是必须与用户 2 的评分相乘?喜欢(1*2)+(1*3)+(4*3)
?
我对[p1][it]
. 我希望你能帮助我,谢谢你的提前。
r - R:构建具有数值变量之间所有成对相关性和显着性水平的数据框
为了能够获得数据框中所有数值变量之间的成对相关性和显着性水平,我编写了以下小函数:
我只是想知道是否有更短更优雅的方法可以做到这一点,或者这种功能是否已经在某些包中实现?(我在 Hmisc 中看到了对 rcorr 的一些引用,但它输出了两个矩阵,这对我没有好处,因为我只想输出一个数据帧)。
有什么想法吗?
干杯,汤姆
r - t-test of the Pearson correlation in R
While looking at the cor.test function in R, used to compute (among others) the Pearson correlation, I saw that the t-statistics, used later to calculate the p-value is
where r is the correlation measure, and df is the number of degrees of freedom.
But the t-test for a Pearson correlation seems rather to be: (cf. http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient#Testing_using_Student.27s_t-distribution)
As always, given that the cor.test is widely used I suspect first a misunderstanding from my side. Does anyone know whether the definition used in cor.test is correct?
Thanks
similarity - 皮尔逊相关相似度和调整余弦相似度有什么区别?
虽然它们非常相似,但我确信 Pearson 相关相似度和调整余弦相似度之间存在一些差异,因为所有的论文和网页都将它们分为两种不同的类型。
然而,它们都没有提供明确的定义。这是其中一页。
谁能说出区别?
谢谢