问题标签 [significance]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
statistics - 何时需要进行多重比较校正?
我在假设检验方面不是很有经验,并且在发生多重比较问题时有问题的理解?
正如我所理解的多重比较问题发生在尝试从单个数据库执行多个统计测试时。因此,为了得出正确的结论,应调整显着性水平。(我对吗?)
在我的情况下,我有一个数据库,我对数据库的不同部分执行了几个 t 检验。换句话说,每个测试的数据与另一个测试完全不同,而所有数据都属于一个数据库。所以,原则上我的测试中不应该存在多重比较问题,对吗?
提前致谢。
r - R中的手动t检验,尾部检验
我一直在尝试对我在 r 中计算的统计数据进行手动 t 检验。我见过有人推荐使用函数 dt ,但没有奏效。我知道是因为我将 R 的结果与我在 STATA 中的结果进行比较(我确定最后一个结果是正确的)。这是我正在尝试执行此操作的代码
其中 3.141523 是我计算的 t 统计量,df 是自由度。谢谢您的帮助!
p-value - 我的 p 值太低 (p<<0.01)
我知道通常较低的 P 值是好的,因为我想拒绝 H0 假设。但是我的问题很奇怪,如果您能给我任何帮助或见解,我将不胜感激。
我使用庞大的数据集(n>1,000,000),每个代表一年的数据。我需要分析数据并找出当年的平均值是否与上一年的平均值有 显着 差异。然而,每个人都希望它不重要而不是重要。
在“显着”中,我的意思是我希望能够告诉我的老板——“看,那些不显着的变化是噪音,而那些显着的变化代表着真正需要考虑的事情”。
问题在于,简单地将两个平均值与 T 检验进行比较总是会导致显着差异,即使差异非常非常小(可能是由于样本量大)并且落在现实的 OK 区域内。所以基本上按照我的看法,P 值不能很好地满足我的需求。
你觉得我应该怎么做?
r - 使用 r 测试相关系数向量的显着性
我有一个相关系数向量 (r) 和一个包含观察次数 (n) 的向量,我想测试它们中的每一个以查看它们是否与 0 显着不同。
计算 t 值很容易,但是有没有办法使用 R 来测试它们,而不是求助于统计书后面的表格?
python - Python-如何对二维数组进行 f 测试?
问题
我有两个数组,我们称它们为 ar1 和 ar2(大小 (192,289)),它们代表标准差的经纬度图,并且我有一个大小相似的它们的差异数组。我想绘制差异,并在顶部绘制一个点画图案,其中两个数组之间的差异在 95% 置信水平(alpha = 0.05)上具有统计显着性。
编码
我正在使用此示例进行编码-
我使用了 Joel Cornett 的解决方案,用ar1
andar2
代替 X 和 Y。
0.118586507371 0.161485609461
0.734347213766
对于下一部分,我需要 N-2 个自由度来进行分析,其中 N 是数组中的点数,在本例中为 55848 (192 x 289)。len(ar1)
并且len(ar2)
在这里不起作用,因为那些只给出第一个维度的长度,所以我尝试将数组展平以获得正确的长度。
55486 55486
但是,继续前进,我的 p 值为 9.88365269356e-289(基本上为 0)。这是一个单一的值,正如我在这种特殊情况下所期望的那样,在统计上是微不足道的,但我需要一组值来进行点画,以便我可以查看网格上是否存在差异显着的地方。我只是不确定如何在二维数组上执行此测试,因为我找到的所有示例都使用列表或其他一维数据类型,而且我以前也从未做过这样的分析。(我是应我的顾问的要求做的,他不使用 Python)。
问题
如何对两个二维数组执行 f 检验,结果给出一个大小相似的数组,为每个网格点提供一个 p 值?
如果可能的话,我可以修改它以填写由于对主题缺乏了解而可能遗漏的任何内容(让我知道我得到的 p 值似乎不正确),但如果它太复杂或不完整求大神帮忙,我删了
r - 我应该将学习期视为r中多元线性回归的序数变量吗?
我有一个称为人均收入的响应变量。它与预测变量、研究期相关联。研究期是一个具有三个水平的因素,其中第一个时期跨越 2008-2009 年,第二个时期跨越 2010-2012 年和第三个时期,2013-2015 年。
我想用这两个变量和其他变量(年龄和性别)在 r 中执行多元线性回归。简而言之,公式是人均收入~学习年限+年龄+性别。
我以两种方式执行回归:
- 将学习期视为名义或无序:
lm(PCI ~ factor(STUDY_PERIOD) + AGE + GENDER, data = df)
- 将学习期视为有序的或有序的:
两者都给出了研究期间的不同系数。
我的问题:
- 我应该考虑
STUDY_PERIOD
什么? - 我如何解释这两种情况下的系数?
谢谢!
r - 如何对R中的分组变量进行显着性检验?
我有以下代码:
产生:
我想测试一下,var1中每个相似级别的“INK”和“KON”之间的差异是否显着,即“Handtuch INK”与“Handtuch KON”显着不同,“Kissen INK”与“Kissen”显着不同康”等。
任何人都可以帮助我正确的 R 代码吗?谢谢你。
r - 测试 R 中特定多个组的显着性
数据如下所示:
我想执行显着性检验来比较 rev.1 和 rev.2 的均值,仅在分组 class.1=class.2 的情况下。我尝试使用 ANOVA 进行此操作,但仅比较我想要的组时遇到问题。任何指导将不胜感激!