问题标签 [hypothesis-test]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
142 浏览

r - 模型假人线性假设期间的节点堆栈溢出

我希望你星期天过得愉快。

我有一个关于 868 家银行在 94 个时间段内的银行股票收益的面板数据集,其中我创建了时间和银行虚拟变量。定义了不同的回归配置后,我想使用 linearHypothesis() 测试各个虚拟集的联合显着性。

虽然这对于时间假人来说完全正常,但在尝试测试银行假人时出现以下错误:

以下是我的 (i) 代码。创建假人,(ii) 定义 lm() 和 (iii) 运行假设检验:

这是我的面板数据集的 summary() 和 str() 的屏幕截图:

概括()

字符串()

以前从未遇到过此错误,我也找不到与 linearHypothesis() 相关的此错误的任何信息。我还发现时间假人的联合测试工作完美,这让我感到困惑,因为这两个假人集是以相同的方式创建的。任何建议将不胜感激。

0 投票
1 回答
792 浏览

python - 为什么我的 adfuller 测试总是得零?

constant_all = [38.315546998853549, 40.187217618535399, 43.71380567455396, 45.450748920811293, 50.112269986599735, 59.275158665010736, 65.979556682432815, 106.81142772445702, 122.61124737594076, 160.38976378829483, 109.69662873794118, 86.785774468513864, 73.201627114685436, 62.980558157294979, 60.149903740134562, 54.010569668890867, 54.657627915195405, 57.065262050299623, 59.576109894133168, 61.568376379726971, 64.51074294474725]

我得到了一个类似上面的列表。然后我通过使用运行adfuller测试cadf = ts.adfuller(constant_all),然后我想通过访问p值cadf[0]

但是,我总是得到零。我做错什么了吗?

0 投票
1 回答
2696 浏览

r - linearHypothesis() 用于测试 I(X) 中包含的项的系数

我打算在以下模型中使用 lht 命令测试系数:

但是,当我尝试投入I(D1*LOGA)使用时lht(),它会产生错误:

我想知道如何正确地在模型中进行测试?D1*LOGA我知道一个(不是那么聪明的方法)是在运行回归之前创建一个值等于的变量。但是有没有更方便的方法或者做呢?

0 投票
0 回答
1764 浏览

r - 找出两组之间是否有任何差异:逻辑回归与 t 检验

为了确定两组之间的均值是否存在差异,我们使用如下 t 检验。我使用 mtcars 数据集。

我的问题是如果我使用逻辑回归怎么办?p值不同。为了实现相同的目标,如果我使用逻辑回归与 t.test 有什么区别吗?有人可以澄清一下吗?

0 投票
0 回答
65 浏览

r - R卡方测试准备

我希望确认我的 Chi Square 测试设置正确。我有 2 个变量和 1 个观察值,即每条推文的数量。我只是想确认我的设置是否正确。

代码:

0 投票
2 回答
553 浏览

r - 检验零偏斜的原假设

我需要测试零假设,即我的稳定收益具有零偏度,置信水平为 95%。你有什么想法我可以用哪种公式来做这种测试?我尝试了 Agostino 偏度测试,但认为这不是最好的方法,因为我无法设置置信水平。

0 投票
1 回答
2926 浏览

r - 如何比较两个概率密度函数?

我有两个概率密度函数,我想知道它们的分布是否相似。我知道 R 中的 KS 测试可以做到这一点,但是当我运行代码时,会发生错误。谢谢你的帮助。

0 投票
1 回答
36 浏览

machine-learning - 为什么假设要引入两个参数,即θ0和θ1

我从 Andrew Ng 教授的 Coursera 课程中学习机器学习。讲师将假设定义为“输入”(在我的情况下为 x)的线性函数,如下所示:

h θ (x) = θ 0 + θ 1 (x)

在监督学习中,我们有一些训练数据,并在此基础上尝试“推断”一个函数,该函数将输入紧密映射到相应的输出。为了推导函数,我们将假设作为输入 (x) 的线性函数引入。我的问题是,为什么选择涉及两个 θs 的函数?为什么它不能像y( i) = a * x( i)那样简单,系数在哪里a?稍后我们可以使用算法a为给定示例找到一个“好的”值?(i)这个问题可能看起来很愚蠢。我很抱歉,但我不太擅长机器学习,我只是一个初学者。请帮助我理解这一点。

谢谢!

0 投票
0 回答
421 浏览

r - Kruskal-Wallis 检验能否用于检验多个因素中多个组的显着性?

我试图在 Kruskal-Wallis 上阅读我所能阅读的内容,虽然我找到了一些有用的信息,但我似乎仍然找不到我的问题的答案。我正在尝试使用 Kruskal-Wallis 检验来确定多个因素中多个组在预测一组因变量时的重要性。

这是我的数据示例:

在这个例子中,我的因变量是“AcgVor”、“PNatGR”和“NatGrHt”,而自变量(因子)是“Season”、“Grazing”和“Cattle_Type”。如您所见,我的每个因素都有 2 个组级别。

我想要完成的是运行一个非参数测试,查看我的因子组对我的每个因变量的单独和组合重要性。我选择了 Krukal-Wallis,它似乎可以一次测试我的一个分组因素。

这是 AvgVor ~ Grazing 的结果

这告诉我,根据放牧前或放牧后的记录,AvGVor 存在显着差异。

有没有办法使用 Kruskal-Wallis 构建一个包含我所有分组因素的类似模型?即使我必须为每个因变量运行一个单独的变量。

我尝试了以下代码,但它有缺陷。

0 投票
1 回答
1598 浏览

statistics - 为什么在计算 z 分数时将样本标准差除以 sqrt(样本大小)

我一直在关注可汗学院的视频以了解假设检验,我必须承认,到目前为止我的所有理解都是基于该来源。现在,以下视频讨论 z 分数/假设检验:

假设检验

Z 统计量与 T 统计量

现在,我开始怀疑,这完全是关于 z 分数中的分母:

  1. 对于 z 分数公式,即:z = (x – μ) / σ,当总体的标准偏差 (σ) 已知时,我们直接使用它。但是当它未知时,并且我们使用抽样分布,那么我们有 z = (x – μ) / (σ / √n); 我们用 σ s估计 σ ;其中σ s是样本的标准差,n 是样本大小。

那么 z 分数 = (x – μ) / (σ s / √n)。当 σ s 已知时,为什么要除以 √n ?即使在视频中,假设检验 - Sal 也将样本的标准差除以 √n。当 σ s直接给出时,我们为什么要这样做?

请帮我理解。

  1. 我尝试将其应用于以下问题,并遇到以下问题:

问题:Yardley 设计了新香水。Yardley 公司声称,一个新香水瓶平均可以使用 300 天。另一家公司从 Yardley 随机抽取 35 支新香水瓶进行测试。采样瓶的平均使用时间为 190 天,标准偏差为 50 天。如果 Yardley 的说法是正确的,随机选择的 35 个瓶子的平均寿命不超过 190 天的概率是多少?

所以,上面的问题,当我执行以下操作时:

z = (190-300)/(50/√35),我们得到 z = -13.05,这不是一个可能的分数,因为 z 分数应该在 +-3 之间。

当我这样做时,z = (190-110)/50,或者更确切地说是 z = (x – μ) / σ,我似乎在这里得到了一个可以接受的答案。

请帮我弄清楚我错过了什么。