问题标签 [statistics-bootstrap]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R 中的引导包简单帮助
如果我想使用boot()
Rboot
包中的函数来计算两个向量之间的 Pearson 相关系数的显着性,我应该这样做:
re1
这两个观察向量的两列矩阵在哪里?cor
由于这些向量 is ,我似乎无法正确理解0.8
,但上面的函数返回-0.2
as t0
。
r - 如何获得自举 p 值和自举 t 值以及函数 boot() 是如何工作的?
我想获得 lm 的自举 t 值和自举 p 值。我有以下有效的代码(基本上是从论文中复制的)。
现在,我计算引导模型,它给了我以下信息:
我有两个问题:
我的理解是自举值是原始值加上偏差,这意味着自举值(自举 t 值和自举 p 值)都大于原始值。这反过来又是不可能的,因为如果 t 值上升(这意味着更重要),p 值必须更低,对吧?因此我认为我还没有真正理解引导函数的输出(这里:)
duncan.boot
。如何计算引导值?我不明白 boot() 是如何工作的。如果你看
duncan.boot <- boot(Duncan, boot.function, 1999)
你会发现我没有为函数“boot.function”传递任何参数。我想 R 设置data <- Duncan
. 但由于我没有为参数“indices”传递任何东西,我不明白函数“boot.function”中的以下行是如何工作的data <- data[indices,]
我希望这些问题有意义!???
time-series - 时间序列数据的重采样
假设我有一个整数数组。每个整数代表 10 分钟窗口内对数据库的请求数。该数组包含 20,000 个数字,代表 4 个月的连续 10 分钟窗口期。现在假设我有 10 个这样的数组,它们来自 10 个不同的真实世界数据库。
现在我想从现有的 10 个数组中生成 400 个数组。我没有太多的统计背景,但我读到简单的引导不适用于时间序列数据(或一般的相关数据)。是否有一种基于引导的简单方法适用于时间序列数据,以及哪些软件(独立或库,最好是免费的)可以在不花费超过 2 天的开发时间的情况下完成这项工作?
谢谢你的帮助,简
r - 添加置信区间以绘制 R 中的模拟数据
我创建了一个基于似然函数和模拟的概率模拟,所有这些都可以使用下面的代码进行复制。
这是似然函数:
这是进行估计的功能:
这是生成模拟模型的函数:
这模拟了一个 n 大小等于 100:
下面的这个函数将基于非参数引导方法计算置信区间(注意正在使用的示例函数):
下面的这个函数只是清理引导输出,置信区间是我想要绘制的:
我想绘制这样的图(下图),但根据上面的 processres 函数添加置信区间。如何将这些置信区间添加到图中?
我也对不同的情节代码和/或包持开放态度。我只想要一个基于此模拟的图表,并添加置信区间。
谢谢!
r - R中的自举置信区间
我是新的 R 用户,在使用引导包时遇到问题。我想要做的就是使用自举生成围绕数字向量均值的置信区间,例如:
有小费吗?
r - 用于引导分析的模拟数据集
我的目标是使用自举(1000 次重复)来计算 r(皮尔逊相关系数)的空分布、均值和 CI,这些与从我的 600 个唯一个体 (ID) 的数据集生成的 20 个受激随机对中的特征 (x) 相关。我最近从 SAS 切换到 R,我将使用“procsurveyselect”来生成数据集。问题:
- 产生这些结果的最有效方法是什么(见下面我的尝试)?
- 在我的示例中,我将如何使用 set.seed 命令来复制我的结果?
具有 600 个人和相关特征值的模拟起始数据集:
然后我生成 r 的 1000 次重复并计算 95% CI:
r - 函数有效(boot.stepAIC)但在另一个函数中引发错误 - 环境问题?
我今天在我的 R 代码中意识到了一个奇怪的行为。我尝试了一个包 {boot.StepAIC},其中包含一个引导函数,用于使用 AIC 逐步回归的结果。但是我不认为统计背景是问题所在(我希望如此)。
我可以在 R 的顶层使用该函数。这是我的示例代码。
但是,我想将其包装在自己的函数中。我将数据和公式传递给该函数。但是我在 boot.stepAIC() 中收到错误消息:
模型拟合在 100 个引导样本中失败 strsplit(nam.vars, ":") 中的错误:非字符参数
那么错误在哪里呢?我想这一定与当地和全球环境有关,不是吗?
r - 带箱线图类型分组的点距图
我有可以用箱线图绘制的数据,但每个框的 n 仅为 3。我想在 ggplot2 中使用点范围类型的图来绘制它们。默认情况下,它们相互重叠。当它们在箱线图中分组时,如何将我的点并排分组?
编辑:我更新了问题以按照建议排除自举(最初的想法是使用置信区间作为误差线。一个问题的问题太多=D)。此处给出了更详细的引导问题
python - 用于引导置信区间和非参数多数据集比较的 Python 统计包
我正在寻找一个 Python 包,它可以计算一个/两个引导置信区间并执行非参数多数据集比较。有人知道吗?
r - 如何从 elrm 汇总输出中提取系数
我使用包对我的数据集进行了精确的逻辑回归elrm
我将它与普通的逻辑回归进行比较。
我能够在普通逻辑回归上运行引导程序,我提取的感兴趣的统计数据是估计系数和 p 值。
但是,我无法运行我的 elrm 引导程序,因为我无法从输出中提取所需的系数。
使用我的数据,摘要会打印出来:
我想提取 M 估计值和 p 值,以便在进行引导时提取这些统计信息。我尝试了一堆不同的组合来尝试提取值,但它们不起作用。
所有这些只是再次吐出摘要。
有谁知道是否可以从 elrm 摘要中提取?
任何帮助,将不胜感激。