问题标签 [statistics-bootstrap]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3058 浏览

r - R 中的引导包简单帮助

如果我想使用boot()Rboot包中的函数来计算两个向量之间的 Pearson 相关系数的显着性,我应该这样做:

re1这两个观察向量的两列矩阵在哪里?cor由于这些向量 is ,我似乎无法正确理解0.8,但上面的函数返回-0.2as t0

0 投票
1 回答
6180 浏览

r - 如何获得自举 p 值和自举 t 值以及函数 boot() 是如何工作的?

我想获得 lm 的自举 t 值和自举 p 值。我有以下有效的代码(基本上是从论文中复制的)。

现在,我计算引导模型,它给了我以下信息:

我有两个问题:

  1. 我的理解是自举值是原始值加上偏差,这意味着自举值(自举 t 值和自举 p 值)都大于原始值。这反过来又是不可能的,因为如果 t 值上升(这意味着更重要),p 值必须更低,对吧?因此我认为我还没有真正理解引导函数的输出(这里:)duncan.boot。如何计算引导值?

  2. 我不明白 boot() 是如何工作的。如果你看duncan.boot <- boot(Duncan, boot.function, 1999)你会发现我没有为函数“boot.function”传递任何参数。我想 R 设置data <- Duncan. 但由于我没有为参数“indices”传递任何东西,我不明白函数“boot.function”中的以下行是如何工作的data <- data[indices,]

我希望这些问题有意义!???

0 投票
0 回答
973 浏览

time-series - 时间序列数据的重采样

假设我有一个整数数组。每个整数代表 10 分钟窗口内对数据库的请求数。该数组包含 20,000 个数字,代表 4 个月的连续 10 分钟窗口期。现在假设我有 10 个这样的数组,它们来自 10 个不同的真实世界数据库。

现在我想从现有的 10 个数组中生成 400 个数组。我没有太多的统计背景,但我读到简单的引导不适用于时间序列数据(或一般的相关数据)。是否有一种基于引导的简单方法适用于时间序列数据,以及哪些软件(独立或库,最好是免费的)可以在不花费超过 2 天的开发时间的情况下完成这项工作?

谢谢你的帮助,简

0 投票
1 回答
3219 浏览

r - 添加置信区间以绘制 R 中的模拟数据

我创建了一个基于似然函数和模拟的概率模拟,所有这些都可以使用下面的代码进行复制。

这是似然函数:

这是进行估计的功能:

这是生成模拟模型的函数:

这模拟了一个 n 大小等于 100:

下面的这个函数将基于非参数引导方法计算置信区间(注意正在使用的示例函数):

下面的这个函数只是清理引导输出,置信区间是我想要绘制的:

我想绘制这样的图(下图),但根据上面的 processres 函数添加置信区间。如何将这些置信区间添加到图中?

我也对不同的情节代码和/或包持开放态度。我只想要一个基于此模拟的图表,并添加置信区间。

谢谢!

0 投票
1 回答
7580 浏览

r - R中的自举置信区间

我是新的 R 用户,在使用引导包时遇到问题。我想要做的就是使用自举生成围绕数字向量均值的置信区间,例如:

有小费吗?

0 投票
2 回答
974 浏览

r - 用于引导分析的模拟数据集

我的目标是使用自举(1000 次重复)来计算 r(皮尔逊相关系数)的空分布、均值和 CI,这些与从我的 600 个唯一个体 (ID) 的数据集生成的 20 个受激随机对中的特征 (x) 相关。我最近从 SAS 切换到 R,我将使用“procsurveyselect”来生成数据集。问题:

  1. 产生这些结果的最有效方法是什么(见下面我的尝试)?
  2. 在我的示例中,我将如何使用 set.seed 命令来复制我的结果?

具有 600 个人和相关特征值的模拟起始数据集:

然后我生成 r 的 1000 次重复并计算 95% CI:

0 投票
1 回答
1781 浏览

r - 函数有效(boot.stepAIC)但在另一个函数中引发错误 - 环境问题?

我今天在我的 R 代码中意识到了一个奇怪的行为。我尝试了一个包 {boot.StepAIC},其中包含一个引导函数,用于使用 AIC 逐步回归的结果。但是我不认为统计背景是问题所在(我希望如此)。
我可以在 R 的顶层使用该函数。这是我的示例代码。

但是,我想将其包装在自己的函数中。我将数据和公式传递给该函数。但是我在 boot.stepAIC() 中收到错误消息:

模型拟合在 100 个引导样本中失败 strsplit(nam.vars, ":") 中的错误:非字符参数

那么错误在哪里呢?我想这一定与当地和全球环境有关,不是吗?

0 投票
1 回答
2363 浏览

r - 带箱线图类型分组的点距图

我有可以用箱线图绘制的数据,但每个框的 n 仅为 3。我想在 ggplot2 中使用点范围类型的图来绘制它们。默认情况下,它们相互重叠。当它们在箱线图中分组时,如何将我的点并排分组?

编辑:我更新了问题以按照建议排除自举(最初的想法是使用置信区间作为误差线。一个问题的问题太多=D)。此处给出了更详细的引导问题

在此处输入图像描述

0 投票
1 回答
6431 浏览

python - 用于引导置信区间和非参数多数据集比较的 Python 统计包

我正在寻找一个 Python 包,它可以计算一个/两个引导置信区间并执行非参数多数据集比较。有人知道吗?

0 投票
2 回答
5922 浏览

r - 如何从 elrm 汇总输出中提取系数

我使用包对我的数据集进行了精确的逻辑回归elrm

我将它与普通的逻辑回归进行比较。

我能够在普通逻辑回归上运行引导程序,我提取的感兴趣的统计数据是估计系数和 p 值。

但是,我无法运行我的 elrm 引导程序,因为我无法从输出中提取所需的系数。

使用我的数据,摘要会打印出来:

我想提取 M 估计值和 p 值,以便在进行引导时提取这些统计信息。我尝试了一堆不同的组合来尝试提取值,但它们不起作用。

所有这些只是再次吐出摘要。

有谁知道是否可以从 elrm 摘要中提取?

任何帮助,将不胜感激。