问题标签 [statistics-bootstrap]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

562 问题

0 投票

1 回答

3058 浏览

r - R 中的引导包简单帮助

如果我想使用boot()Rboot包中的函数来计算两个向量之间的 Pearson 相关系数的显着性，我应该这样做：

re1这两个观察向量的两列矩阵在哪里？cor由于这些向量 is ，我似乎无法正确理解0.8，但上面的函数返回-0.2as t0。

r correlation statistics-bootstrap

Ian Stuart

2011-10-20T10:08:14.573

0 投票

1 回答

6180 浏览

r - 如何获得自举 p 值和自举 t 值以及函数 boot() 是如何工作的？

我想获得 lm 的自举 t 值和自举 p 值。我有以下有效的代码（基本上是从论文中复制的）。

现在，我计算引导模型，它给了我以下信息：

我有两个问题：

我的理解是自举值是原始值加上偏差，这意味着自举值（自举 t 值和自举 p 值）都大于原始值。这反过来又是不可能的，因为如果 t 值上升（这意味着更重要），p 值必须更低，对吧？因此我认为我还没有真正理解引导函数的输出（这里：）duncan.boot。如何计算引导值？
我不明白 boot() 是如何工作的。如果你看duncan.boot <- boot(Duncan, boot.function, 1999)你会发现我没有为函数“boot.function”传递任何参数。我想 R 设置data <- Duncan. 但由于我没有为参数“indices”传递任何东西，我不明白函数“boot.function”中的以下行是如何工作的data <- data[indices,]

我希望这些问题有意义！？？？

r statistics-bootstrap

2011-11-25T20:15:10.267

0 投票

0 回答

973 浏览

time-series - 时间序列数据的重采样

假设我有一个整数数组。每个整数代表 10 分钟窗口内对数据库的请求数。该数组包含 20,000 个数字，代表 4 个月的连续 10 分钟窗口期。现在假设我有 10 个这样的数组，它们来自 10 个不同的真实世界数据库。

现在我想从现有的 10 个数组中生成 400 个数组。我没有太多的统计背景，但我读到简单的引导不适用于时间序列数据（或一般的相关数据）。是否有一种基于引导的简单方法适用于时间序列数据，以及哪些软件（独立或库，最好是免费的）可以在不花费超过 2 天的开发时间的情况下完成这项工作？

谢谢你的帮助，简

time-series resampling statistics-bootstrap

2012-01-04T19:50:57.893

0 投票

1 回答

3219 浏览

r - 添加置信区间以绘制 R 中的模拟数据

我创建了一个基于似然函数和模拟的概率模拟，所有这些都可以使用下面的代码进行复制。

这是似然函数：

这是进行估计的功能：

这是生成模拟模型的函数：

这模拟了一个 n 大小等于 100：

下面的这个函数将基于非参数引导方法计算置信区间（注意正在使用的示例函数）：

下面的这个函数只是清理引导输出，置信区间是我想要绘制的：

我想绘制这样的图（下图），但根据上面的 processres 函数添加置信区间。如何将这些置信区间添加到图中？

我也对不同的情节代码和/或包持开放态度。我只想要一个基于此模拟的图表，并添加置信区间。

谢谢！

r confidence-interval statistics-bootstrap

2012-02-06T22:53:46.233

0 投票

1 回答

7580 浏览

r - R中的自举置信区间

我是新的 R 用户，在使用引导包时遇到问题。我想要做的就是使用自举生成围绕数字向量均值的置信区间，例如：

有小费吗？

r confidence-interval statistics-bootstrap

2012-02-16T02:16:48.807

0 投票

2 回答

974 浏览

r - 用于引导分析的模拟数据集

我的目标是使用自举（1000 次重复）来计算 r（皮尔逊相关系数）的空分布、均值和 CI，这些与从我的 600 个唯一个体 (ID) 的数据集生成的 20 个受激随机对中的特征 (x) 相关。我最近从 SAS 切换到 R，我将使用“procsurveyselect”来生成数据集。问题：

产生这些结果的最有效方法是什么（见下面我的尝试）？
在我的示例中，我将如何使用 set.seed 命令来复制我的结果？

具有 600 个人和相关特征值的模拟起始数据集：

然后我生成 r 的 1000 次重复并计算 95% CI：

r random-sample statistics-bootstrap

2012-03-15T10:21:04.280

0 投票

1 回答

1781 浏览

r - 函数有效（boot.stepAIC）但在另一个函数中引发错误 - 环境问题？

我今天在我的 R 代码中意识到了一个奇怪的行为。我尝试了一个包 {boot.StepAIC}，其中包含一个引导函数，用于使用 AIC 逐步回归的结果。但是我不认为统计背景是问题所在（我希望如此）。
我可以在 R 的顶层使用该函数。这是我的示例代码。

但是，我想将其包装在自己的函数中。我将数据和公式传递给该函数。但是我在 boot.stepAIC() 中收到错误消息：

模型拟合在 100 个引导样本中失败 strsplit(nam.vars, ":") 中的错误：非字符参数

那么错误在哪里呢？我想这一定与当地和全球环境有关，不是吗？

r statistics-bootstrap

2012-04-16T14:55:12.603

0 投票

1 回答

2363 浏览

r - 带箱线图类型分组的点距图

我有可以用箱线图绘制的数据，但每个框的 n 仅为 3。我想在 ggplot2 中使用点范围类型的图来绘制它们。默认情况下，它们相互重叠。当它们在箱线图中分组时，如何将我的点并排分组？

编辑：我更新了问题以按照建议排除自举（最初的想法是使用置信区间作为误差线。一个问题的问题太多=D）。此处给出了更详细的引导问题

在此处输入图像描述

r ggplot2 plot confidence-interval statistics-bootstrap

2012-04-26T09:04:07.580

0 投票

1 回答

6431 浏览

python - 用于引导置信区间和非参数多数据集比较的 Python 统计包

我正在寻找一个 Python 包，它可以计算一个/两个引导置信区间并执行非参数多数据集比较。有人知道吗？

python statistics statistics-bootstrap

2012-05-09T21:21:29.763

0 投票

2 回答

5922 浏览

r - 如何从 elrm 汇总输出中提取系数

我使用包对我的数据集进行了精确的逻辑回归elrm

我将它与普通的逻辑回归进行比较。

我能够在普通逻辑回归上运行引导程序，我提取的感兴趣的统计数据是估计系数和 p 值。

但是，我无法运行我的 elrm 引导程序，因为我无法从输出中提取所需的系数。

使用我的数据，摘要会打印出来：

我想提取 M 估计值和 p 值，以便在进行引导时提取这些统计信息。我尝试了一堆不同的组合来尝试提取值，但它们不起作用。

所有这些只是再次吐出摘要。

有谁知道是否可以从 elrm 摘要中提取？

任何帮助，将不胜感激。

r extraction statistics-bootstrap

2012-06-29T18:49:07.830

1 2 3 4 5 6 7 8 9 10