问题标签 [statistics-bootstrap]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
matlab - Matlab Bootstrap没有完成重采样
我想在 Matlab 中执行引导程序。我有 100 个原始数据点,我希望引导程序的每次迭代都随机选择 57 个替换点。我该如何完成它?
我似乎在 Matlab 函数中找不到这个功能bootstrp
。
问候,
r - 来自引导 GLM 列表的 LC50 计算
我正在尝试从引导的 GLM 输出列表中计算 LC50
我将引导 GLM 的输出放在一个列表(命名结果)中,如下所示:(为了方便起见,我刚刚放入了最后一个结果,而不是整个列表)
dose.p
从包中使用MASS
我正在尝试为已运行的模型中的每个人计算 LC50
返回
据我了解,这是我放入factor(female.no[x])3.
的LC50,我认为它是第2 列和第 3 列,以及dose.p
cf = c(2,3)
concentration
factor(female.no[x])3.
这个对吗?
其次:
有没有一种方法可以为每个女性获得 LC50,即factor(female.no[x])3
, factor(female.no[x])4
等等 factor(female.no[x])7
,我不知道如何dose.p
在不手动更改代码的情况下根据不同的变量进行工作cf=
:
最后:我的结果存储在一个列表中,我如何才能dose.p
沿着列表工作,它会是这样的:
谢谢你的帮助
machine-learning - Bootstrap aggregation (bagging) of logistic regression classifiers
So I'm taking N bootstrap samples and training N logistic regression classifiers on these samples. Each classifier gives me some probability of being in a binary class and then I average these N probabilities to get a final prediction.
My question is if I took the N sets of regression coefficients and averaged those and used that averaged set of coefficients in a logistic regression classifier and took the output probability as the final prediction, is this the same as taking the average of the resultant N probabilities as described in the previous paragraph?
r - 使用 isplit 进行块引导
我有以下示例数据集
我想通过变量“站点”对行进行子集化,然后引导每个站点陷阱率(TR)。我尝试使用以下代码
但这只是返回
理想情况下,我希望每个站点都有一个带有 meanTraps 的数据框。任何人都可以帮助纠正我的错误吗?
r - 如何在 R 中实现引导程序
所以我发布了一个关于这个问题的帖子,但它被搁置了。所以我改写了,所以它可能是一个编程问题。这是我下面的代码。我正在尝试使用引导程序找到样本的受刺激置信水平。
# 第一步:从对数正态分布生成数据
# 第二步:计算 B=1000 的 95% Bootstrap CI
如果您执行此代码,您可以看到输出是 975.025,而实际上它应该是 0。90。我不明白为什么我的输出是错误的。
我们不是试图找到置信区间,而是寻找刺激的置信水平。实际覆盖率(通过模拟获得)与名义置信水平(即 95%)相比如何?这是我在练习题中给出示例时的代码......
r - lm 的自举标准误差
我是 R 新手,我可能需要一些帮助。
我已经获得了 y ~ z 的 lm 回归的标准误差和 p 值。现在我想做一个引导程序并比较结果。到目前为止,我只能找到以下用于引导 R 平方值的代码:
我不知道如何返回 z 系数的标准误差而不是 R 平方。$r.squared
将循环的最后一行替换为$sd
不会成功。$sd(z)
类似的事情也不会起作用。
hierarchical-clustering - Jaccard 聚类置信区间
我希望有人能给我建议如何使用 R 从 Jaccard 集群中获取置信区间。我有 1970 年代和今天在四个地点的物种数据。当我运行以下代码时,我得到了一个很好的图表,显示我现在的一个站点比另一个站点更接近历史。我相信人们会问重要性。我在系统发育树上看到过类似的置信区间,但我不确定如何获得这些结果。我假设我通过引导测试执行此操作,但我不确定如何从 boot() 获取结果或如何将它们放在我的集群图上。任何建议将不胜感激。
我制作集群的代码:
然后我用 3 列、站点 1、站点 2 和两个站点的 jaccard 索引制作了 jaccard 结果的 .csv。
jaccardboot <-read.csv("/users/Victoria/Desktop/Stat Documents/jaccardboot.csv", header = TRUE)
结果
我得到:错误启动(数据= jaccardboot,统计= bs,R = 100,公式= site1〜:要替换的项目数不是替换长度的倍数另外:有50个或更多警告(使用警告()查看前 50 个)
r - R中的自举置信区间?
如何通过基本自举置信区间和学生化自举区间计算 T.hat 的 95% 自举置信区间?
谢谢!
java - 如何有效地在 Java 中实现引导(重采样)
我有一个 50,000,000 行的数据文件,需要使用 Java 引导每一行。现在我正在使用 Math.random() 生成随机数,然后以蛮力的方式进行引导。然而,这将带我永远。所以我想知道是否有任何 Java 库可以帮助有效地做到这一点,或者我应该在 Java 中调用其他语言吗?无论如何,我的目标是优化整个过程。谢谢!
r - 自定义引导标准错误:数字“环境”参数不是长度为 1
我正在编写一个自定义脚本来引导 R 中 GLM 中的标准错误并收到以下错误:
eval 中的错误(predvars,data,env):数字“envir”arg 长度不为 1
有人可以解释我做错了什么吗?我的代码:
一个例子:如果我们假设 sims = 1000 并且我们想要 10 列(假设我们有 x1...x10 而不是 x1 和 x2),那么目标是一个包含每个解释变量的 SE 的 1,000 行和 10 列的数据集。