问题标签 [hypothesis-test]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 模型假人线性假设期间的节点堆栈溢出
我希望你星期天过得愉快。
我有一个关于 868 家银行在 94 个时间段内的银行股票收益的面板数据集,其中我创建了时间和银行虚拟变量。定义了不同的回归配置后,我想使用 linearHypothesis() 测试各个虚拟集的联合显着性。
虽然这对于时间假人来说完全正常,但在尝试测试银行假人时出现以下错误:
以下是我的 (i) 代码。创建假人,(ii) 定义 lm() 和 (iii) 运行假设检验:
这是我的面板数据集的 summary() 和 str() 的屏幕截图:
以前从未遇到过此错误,我也找不到与 linearHypothesis() 相关的此错误的任何信息。我还发现时间假人的联合测试工作完美,这让我感到困惑,因为这两个假人集是以相同的方式创建的。任何建议将不胜感激。
python - 为什么我的 adfuller 测试总是得零?
constant_all = [38.315546998853549, 40.187217618535399, 43.71380567455396, 45.450748920811293, 50.112269986599735, 59.275158665010736, 65.979556682432815, 106.81142772445702, 122.61124737594076, 160.38976378829483, 109.69662873794118, 86.785774468513864, 73.201627114685436, 62.980558157294979, 60.149903740134562, 54.010569668890867, 54.657627915195405, 57.065262050299623, 59.576109894133168, 61.568376379726971, 64.51074294474725]
我得到了一个类似上面的列表。然后我通过使用运行adfuller测试cadf = ts.adfuller(constant_all)
,然后我想通过访问p值cadf[0]
。
但是,我总是得到零。我做错什么了吗?
r - linearHypothesis() 用于测试 I(X) 中包含的项的系数
我打算在以下模型中使用 lht 命令测试系数:
但是,当我尝试投入I(D1*LOGA)
使用时lht()
,它会产生错误:
我想知道如何正确地在模型中进行测试?D1*LOGA
我知道一个(不是那么聪明的方法)是在运行回归之前创建一个值等于的变量。但是有没有更方便的方法或者做呢?
r - 找出两组之间是否有任何差异:逻辑回归与 t 检验
为了确定两组之间的均值是否存在差异,我们使用如下 t 检验。我使用 mtcars 数据集。
我的问题是如果我使用逻辑回归怎么办?p值不同。为了实现相同的目标,如果我使用逻辑回归与 t.test 有什么区别吗?有人可以澄清一下吗?
r - R卡方测试准备
我希望确认我的 Chi Square 测试设置正确。我有 2 个变量和 1 个观察值,即每条推文的数量。我只是想确认我的设置是否正确。
代码:
r - 检验零偏斜的原假设
我需要测试零假设,即我的稳定收益具有零偏度,置信水平为 95%。你有什么想法我可以用哪种公式来做这种测试?我尝试了 Agostino 偏度测试,但认为这不是最好的方法,因为我无法设置置信水平。
r - 如何比较两个概率密度函数?
我有两个概率密度函数,我想知道它们的分布是否相似。我知道 R 中的 KS 测试可以做到这一点,但是当我运行代码时,会发生错误。谢谢你的帮助。
machine-learning - 为什么假设要引入两个参数,即θ0和θ1
我从 Andrew Ng 教授的 Coursera 课程中学习机器学习。讲师将假设定义为“输入”(在我的情况下为 x)的线性函数,如下所示:
h θ (x) = θ 0 + θ 1 (x)
在监督学习中,我们有一些训练数据,并在此基础上尝试“推断”一个函数,该函数将输入紧密映射到相应的输出。为了推导函数,我们将假设作为输入 (x) 的线性函数引入。我的问题是,为什么选择涉及两个 θs 的函数?为什么它不能像y
( i
) = a * x
( i
)那样简单,系数在哪里a
?稍后我们可以使用算法a
为给定示例找到一个“好的”值?(i)
这个问题可能看起来很愚蠢。我很抱歉,但我不太擅长机器学习,我只是一个初学者。请帮助我理解这一点。
谢谢!
r - Kruskal-Wallis 检验能否用于检验多个因素中多个组的显着性?
我试图在 Kruskal-Wallis 上阅读我所能阅读的内容,虽然我找到了一些有用的信息,但我似乎仍然找不到我的问题的答案。我正在尝试使用 Kruskal-Wallis 检验来确定多个因素中多个组在预测一组因变量时的重要性。
这是我的数据示例:
在这个例子中,我的因变量是“AcgVor”、“PNatGR”和“NatGrHt”,而自变量(因子)是“Season”、“Grazing”和“Cattle_Type”。如您所见,我的每个因素都有 2 个组级别。
我想要完成的是运行一个非参数测试,查看我的因子组对我的每个因变量的单独和组合重要性。我选择了 Krukal-Wallis,它似乎可以一次测试我的一个分组因素。
这是 AvgVor ~ Grazing 的结果
这告诉我,根据放牧前或放牧后的记录,AvGVor 存在显着差异。
有没有办法使用 Kruskal-Wallis 构建一个包含我所有分组因素的类似模型?即使我必须为每个因变量运行一个单独的变量。
我尝试了以下代码,但它有缺陷。
statistics - 为什么在计算 z 分数时将样本标准差除以 sqrt(样本大小)
我一直在关注可汗学院的视频以了解假设检验,我必须承认,到目前为止我的所有理解都是基于该来源。现在,以下视频讨论 z 分数/假设检验:
现在,我开始怀疑,这完全是关于 z 分数中的分母:
- 对于 z 分数公式,即:z = (x – μ) / σ,当总体的标准偏差 (σ) 已知时,我们直接使用它。但是当它未知时,并且我们使用抽样分布,那么我们有 z = (x – μ) / (σ / √n); 我们用 σ s估计 σ ;其中σ s是样本的标准差,n 是样本大小。
那么 z 分数 = (x – μ) / (σ s / √n)。当 σ s 已知时,为什么要除以 √n ?即使在视频中,假设检验 - Sal 也将样本的标准差除以 √n。当 σ s直接给出时,我们为什么要这样做?
请帮我理解。
- 我尝试将其应用于以下问题,并遇到以下问题:
问题:Yardley 设计了新香水。Yardley 公司声称,一个新香水瓶平均可以使用 300 天。另一家公司从 Yardley 随机抽取 35 支新香水瓶进行测试。采样瓶的平均使用时间为 190 天,标准偏差为 50 天。如果 Yardley 的说法是正确的,随机选择的 35 个瓶子的平均寿命不超过 190 天的概率是多少?
所以,上面的问题,当我执行以下操作时:
z = (190-300)/(50/√35),我们得到 z = -13.05,这不是一个可能的分数,因为 z 分数应该在 +-3 之间。
当我这样做时,z = (190-110)/50,或者更确切地说是 z = (x – μ) / σ,我似乎在这里得到了一个可以接受的答案。
请帮我弄清楚我错过了什么。