问题标签 [statistics-bootstrap]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
5290 浏览

r - R 或 Stata 中分类变量的自举比例

我需要帮助在 R 或 Stata 软件中进行引导。我想计算说“是”和“不”的人的比例,例如政策的有效性

在Stata我有这个代码

r(mean)估计比例的值应该是多少?

另外,我在 R 中有这个代码:

如何更正代码?我收到错误

统计错误(数据,原始,...):未使用的参数(原始)

0 投票
3 回答
20376 浏览

r - R使用引导程序计算标准误差

我有这个值数组:

我想使用包启动来计算数据的标准误差。http://www.ats.ucla.edu/stat/r/faq/boot.htm

于是,我就用这个命令来追求:

我得到了这个错误:

有人可以帮我解决问题吗?谢谢

0 投票
1 回答
2348 浏览

r - R:自举混合模型二元逻辑回归

我需要引导我的混合模型二元逻辑回归。该模型本身运行良好(并且得到了专家朋友的批准和纠正),但自举版本有问题。引导版本之前已被另一位专家朋友批准(在 CrossValidated 中,但后来的 mods 删除了我的帖子,说它不属于 CrossValidated)。但是相同的代码恰好适用于简单的固定效应多元逻辑回归(尽管在这种情况下也有很多类似于此处警告的警告[除了这个针对 lmer() 函数的单一警告:“在 mer_finalize( ans) : 错误收敛 (8)")。

您能否让我知道错误所在的位置以及如何调试它?

非常感谢。

我的代码是(我暂时将复制数量保持得太低而无法调试代码):

. . . 我的错误是:

. . . 你能告诉我如何让 boot() 函数也给出 P 值吗??!它只给出 beta 和 SE 以及偏差和 CI,但我也需要 P 值。

非常感谢。

-------------------------------------------------- - 发展故事----------------------------------------------------------- ------

好的,我很高兴地运行了 Henrik 的漂亮代码。但是代码并没有完全运行。首先它给出了这个错误:

然后我删除了第一个括号块并将语法修改为这个:

这次测试通过了第一步(拟合模型)但未能获得 P 值,再次给出相同的错误和警告:

我不知道如何调试它,或者问题是我的数据集?我应该补充一点,我的数据集完全以均值为中心(所有变量)。DV 仅被否定(因为均值居中不允许 R 起作用,而否定对于二元结果也会做同样的事情)。

-------------------------------------------------- - - - - 更新 - - - - - - - - - - - - - - - - - - - - - --------------------

我将 METHOD 的 PB 值更改为 LRT(如 Henrik 推荐的那样),并且模型的拟合过程已完成,但获取 P 值的过程并未开始:

事实证明,当使用 LRT 时,P 值不是通过引导获得的。因此,结果已经准备好(尽管不是自举的)。

0 投票
2 回答
5709 浏览

r - R:使用新 lme4 包的 bootMer() 引导二进制混合模型逻辑回归

我想使用新 lme4 包(目前是开发者版本)的新 bootMer() 功能。我是 R 新手,不知道应该为其 FUN 参数编写哪个函数。它说它需要一个数值向量,但我不知道该函数将执行什么。所以我有一个混合模型公式,它被转换为 bootMer(),并且有许多复制。所以我不知道那个外部函数是做什么的?它应该是引导方法的模板吗?bootMer中不是已经实现了引导方法吗?那么为什么他们需要一个外部的“感兴趣的统计数据”呢?我应该使用哪个感兴趣的统计数据?

以下语法是否适合使用?R 不断产生错误,即 FUN 必须是数字向量。我不知道如何将估计与“适合”分开,甚至我应该首先这样做吗?我只能说我迷失了那个“有趣”的论点。另外我不知道我应该使用变量“Mixed5”传递混合模型 glmer() 公式还是应该传递一些指针和引用?我在示例中看到 X(bootMer() 的第一个参数是 *lmer() 对象。我想写 *Mixed5 但它呈现错误。

非常感谢。

我的代码是:

和错误:

-------------------------------------------------- - - - 更新 - - - - - - - - - - - - - - - - - - - - - - ----------

我按照 Ben 的指示编辑了代码。代码运行得非常好,但 SE 和 Biase 都为零。你也知道如何从这个输出中提取 P 值(对我来说很奇怪)?我应该使用 afex 包的 mixed() 吗?

我修改后的代码:

-------------------------------------------------- ------ 更新 2 ------------------------------------------ ------------

我也尝试了以下方法,但代码生成了警告并且没有给出任何结果。

警告信息:

-------------------------------------------------- ------ 更新 3 ------------------------------------------ ------------

此代码也生成警告:

警告和结果:

0 投票
1 回答
1058 浏览

r - boot() 在替换时产生错误 - R

我编写了几个函数来从 lm 对象中检索统计数据(系数和 p 值),以供引导。系数一起作用;p 值失败并出现错误:

我现在认为该错误与包含因子变量有关。试图用易于重现的数据重现问题。

在我的初学者眼中,从每个返回的类“数字”值似乎具有完全相同的格式......但我猜不是吗?在运行下一个函数之前,我还清除了返回的 bt bootstrap 对象,但这并没有解决它。我怎样才能最好地检索自举 p 值?感谢您的任何想法。(在 Mac OSX 上运行 R 3.0.1。)

0 投票
2 回答
2095 浏览

r - 与替换长度和数据或数据类型相关的 boot() 错误?-R

boot() 在一个数据集上失败并在另一个数据集上成功......一定是数据问题吗?我只是无法弄清楚区别。但至少现在我认为我已经得到了它的重现性。在这两种情况下,整数和因子变量之间的交互作用都会回归 (lm) 到数值因变量上。boot() 命令失败并出现以下错误:

我返回 p 值的统计函数是:

当我生成随机数据以便在此处重现和发布问题时,如下所示:

然后引导:

引导工作;没有错误;生成的统计数据。但是对于我自己的数据(如下),相同类型的,boot() 返回错误。

线性模型可以单独使用这些数据运行良好。traceback() 除了启动调用之外什么都不产生。请,欢迎任何想法。我在 MAC OSX 上使用 R 3.0.1。谢谢!

0 投票
1 回答
766 浏览

matlab - matlab中的引导方法重采样

我正在生成一个脚本,用于从降水数据集(Matlab 中的 sskt 和 kendall tau 包)创建引导样本(随机)。

我的数据中有一个包含 3 个列的双数组。

第一个是年份,第二个是向量(用于季节或时期),第三个是该站点的降水量(向量是站点的编号,我针对区域趋势运行此方法)。

1970 1 234 1971 1 244 1972 1 344 ... ... 1970 2 342 1971 2 356 ... ... ...

等等......我的每个站点都有 36 年(12 个站点=12x36=432 个数据,分 3 列)

我想要一个 m 脚本文件,我可以为我的数据的 N=5000repetitions 调用函数 sskt。我的数据是一个csv文件,实际上是matlab中的一个双矩阵。我想要每列生成 5000 次重复或 1000 次的引导方法。1000 次重复意味着 1000x36=36000 次重复。当 1000 的第一个循环给我结果时……在这个循环中,我调用了函数 sskt,结果我有 1000 个 S 斜率,1000 个 kendall tau,1000 个符号。有人有想法吗?

0 投票
3 回答
3975 浏览

r - 大数据组的 R 引导统计

我想引导一个包含组的数据集。一个简单的场景是引导简单的方法:

incorrect number of subscripts on matrix由于部分原因,这给了我错误by = "group"。我设法使用子集来解决它,但不喜欢这个解决方案。有没有更简单的方法来完成这种任务?

特别是,我想在统计函数中引入一个额外的参数,stat(x, i, groupvar)并将其传递给引导函数,如boot(data, stat(groupvar = group), R = 100)

0 投票
2 回答
680 浏览

r - R中的自定义引导置信区间

我需要找到一种方法来获取我使用自定义函数获得的估计值的引导置信区间。现在,问题是我有一个大矩阵,我从中随机取出行,然后计算所需的数量。

这是(希望)可重现的示例

生成相似的随机数据:

计算所需量的函数(其中 R 是相关矩阵):

我尝试解决方案的函数(其中 omat 是由一些 mat1 行组成的较小矩阵,freq 是 omat 中的行数,numR 是复制数):

结果向量 b 具有从 mat1 中随机选择的行(由 freq 确定的数量)的矩阵获得的所有值,这些值可以与来自 omat 的 IIvar(由总体成员资格选择的行的矩阵)进行比较。

在 mat1 中,我有 5 个群体(按行分组),我需要分别计算所有这些群体的 IIvar,并为获得的值生成置信区间。

当我像这样运行我的 ciint 函数时

我得到了值的分布,以及“真实”IIvar 值的位置,但我不知道如何从这一点生成 95% 的间隔。

0 投票
1 回答
6078 浏览

r - R - 通过引导带线性模型计算 R 平方和残差标准误差的 95% 置信区间

我是 R 新手,我正在尝试计算 R 平方值的 95% 置信区间,并通过使用引导方法对响应变量进行重新采样,然后通过回归创建 999 个线性模型来形成线性模型的残差标准误差原始解释变量上的这 999 个自举响应变量。

首先,我不确定我是否应该计算原始线性模型(没有引导数据)的 R 平方和残差标准误差的 95% CI,因为这没有意义 - R 平方值对于该线性模型来说是 100% 精确的,并且为它计算 CI 是没有意义的。

那是对的吗?

重要的是,我不确定如何计算我通过自举创建的 999 个线性模型的 R 平方值和残差标准误差值的 CI。