问题标签 [hypothesis-test]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
p-value - 假设检验中的 II 型错误
我是统计学的新手,正在阅读假设检验中的决策错误。我的问题是,为什么 Type-II 错误完全是一个错误?据我了解,当我们未能拒绝错误的零假设时,就会出现这种情况。当我们未能拒绝零假设时,这仅仅意味着我们没有强有力的证据来拒绝它。我们不对这两个假设中的哪一个是真(或假)发表任何评论。两者都可以是真的。我们并不是说零假设是正确的。那么,为什么这样的结论被称为错误呢?
r - 使用 R 进行失拟 F 检验
我学会了如何使用 R 对回归模型的不拟合进行 F 检验,其中 $H_0$:“回归模型中不存在不拟合”。
其中 df_1 是 SSLF 的自由度(失拟平方和),df_2 是 SSPE 的自由度(纯误差的平方和)。
在 R 中,F 检验(例如对于具有 2 个预测变量的模型)可以用
anova(lm(y~x1+x2), lm(y~factor(x1)*factor(x2)))
示例输出:
F 统计量:0.6254,p 值为 0.7419。
由于 p 值大于 0.05,我们不拒绝 $H_0$ 不缺乏拟合。因此模型是足够的。
我想知道的是为什么使用 2 个模型以及为什么使用命令factor(x1)*factor(x2)
?显然,来自 的 12.456Model 2
神奇地是Model 1
.
为什么?
r - 使用 R 在 lpp 上测试 CSR
我最近发布了一个关于正确方法的“R 非常新手”问题,如果您对此感兴趣,可以在 [此处] 找到它。1
我现在设法开发了一个简单的 R 脚本来完成这项工作,但现在的结果让我很困扰。
长话短说,我正在使用 R 来分析lpp
(线性点模式)mad.test
。该函数执行假设检验,其中零假设是点是随机分布的。目前我有88个lpps要分析,根据其中p.value
86个是随机分布的,其中2个不是。
看着它们,您可以在第一个中看到某种簇,但第二个只有三个点,在我看来,无法保证只有三个点不对应于随机分布。还有其他带有一、二、三点的曲目,但它们都属于“随机” lpps 类别,所以我不知道为什么这个不同。
那么问题来了:多少分对于 CSR 测试来说太少了?
我还注意到这两个 lpp$statistic$rank
比其他 lpp 低得多。我试图找出这意味着什么,但我现在一无所知,所以这是另一个新手问题:是$statistic$rank
某种质量分析指标,因此我可以使用它将我的 lpp 分析分组为“重要的”和“积分太少?
我的 R 脚本和所有 shp 文件都可以从这里下载(850 Kb)。
非常感谢你的帮助。
r - R:在线性组合中添加常数, glht()
所以我试图复制我在《计量经济学原理》中看到的一个统计函数,作者是 Hill、Griffiths 和 Lim。我要复制的功能在 stata 中是这样的;
这是针对原假设 H0:B0 + B1*X = C
我可以在没有常数的情况下测试假设,但我想在测试参数的线性组合时添加常数。我浏览了包文档,glht()
但它只有一个示例,他们从中取出了常量。我复制了这个例子,保持不变,但是当你有一个矩阵 K 和一个常数时,我不确定如何测试线性组合。作为参考,这里是他们的例子;
我不太擅长创建假数据集,但这是我的尝试。
根据文档,似乎有两种方法可以解决这个问题。我可以使用函数 diag() 来构造一个矩阵,然后我可以在linfct =
参数中使用它,或者我可以使用一个字符串。这种方法的问题是,我不太清楚如何使用 diag() 方法,同时还包括常数(等式的右侧);在字符串方法的情况下,我不确定如何添加拦截。
任何和所有的帮助将不胜感激。
这是我正在使用的数据。这最初是在一个 .dta 文件中,所以我为可怕的格式道歉。根据我上面提到的书,这是 food.dta 文件。
statistics - 何时需要进行多重比较校正?
我在假设检验方面不是很有经验,并且在发生多重比较问题时有问题的理解?
正如我所理解的多重比较问题发生在尝试从单个数据库执行多个统计测试时。因此,为了得出正确的结论,应调整显着性水平。(我对吗?)
在我的情况下,我有一个数据库,我对数据库的不同部分执行了几个 t 检验。换句话说,每个测试的数据与另一个测试完全不同,而所有数据都属于一个数据库。所以,原则上我的测试中不应该存在多重比较问题,对吗?
提前致谢。
r - 多重假设
我想用一些平均向量和协方差矩阵来模拟来自多元正态分布的两组数据。我想要 N(=3000) 模拟,每个 k(=100) 变量的 n(=30) 个值。所以会有两组 100 个变量,有 30 个观察值。然后我想在这两组之间进行测试。我想做 N 次同样的过程。所以我应该得到每个变量的 N p 个值,即 p 将是一个 2000X100 的矩阵。我怎么能在 r 中做到这一点?我有 ar 代码,但它不起作用。
r - 如何对两个数据框之间的列进行 Wilcoxon 测试
我有两个数据框:
并希望对每列(DF$As,DO$As)等应用 wilcox 测试。我尝试了以下代码:
输出是:
所以我的问题是——我做错了什么?
任何帮助表示赞赏。
r - 在 R 中运行 T.Test 比较两个不同的列
我必须在 R 中对以下内容运行 t.test: 如果 Single 的 YearsAtCompany 小于 Married
这意味着我需要将 YearsatCompany 与婚姻状况进行比较
我努力了:
但这并没有给我正确的信息。我是 R 的新手。并且在这里研究了其他问题,但仍然无法正确编写代码。
样本数据:
r - 孔雀测试实现
我想在统计上比较两个二维分布。因此,我想使用 Peacock 测试(Kolmogorov-Smirnov 测试的 2D 模拟)。有一个名为Peacock.test的 R 包声称可以实现它。
但是这个包的文档非常稀疏,即:
这个包中提供的两个函数:peacock2 和 peacock3 是不言自明的,它们的用法也很简单。
特别是我找不到peacock()
函数的输出代表什么(我猜这有点像 p 值)?有没有人测试过这个功能,他们能告诉我它是什么(这个功能是否可靠?)?
使用示例:
statistics - 对于什么样本均值,p 值等于 0.05
这是一个家庭作业问题。我不是在寻找确切的答案,而是需要一个方向。我有以下问题
H0: µ = 30
HA: µ != 30
我们知道样本标准差为 10,样本大小为 70。对于什么样本均值,p 值等于 0.05?假设推理所需的所有条件都满足。
我正在解决它如下
由于我们的 H0 基于等号,所以我们的测试是双向的,我们需要检查较小和较大的值。
概率表中 0.05 的 P 值等于 1.65 的 z 分数。我们需要计算 SE,然后使用 Z 公式求均值
所以,通过这种方式,我得到一个平均值。但我们的测试是双向的。所以我需要另一个平均值。我没有得到我该如何解决它。任何建议或想法都将是可观的。谢谢