问题标签 [sample-size]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hierarchical-clustering - 在 R 中使用 wp.crt2arm 命令进行集群随机试验设计的样本大小和集群大小
我正在尝试使用 wp.crt2arm 计算集群大小,但在尝试执行代码时遇到以下错误: wp.crt2arm(f=0.25, n=15, icc=0.1, alpha=0.05, power=0.80,替代=c(“双面”))
错误:nuniroot(function(J) eval(p.body) - power, ifelse(is.null(interval), 中的错误:请提供一个包含两个值的区间,例如 c(0,1)。
任何人都可以帮助解决这个问题。谢谢!
r - 两阶段聚类抽样的功效计算
我正在尝试R
为调查实验做一些功率计算。
我知道如何使用pwr
命令来做到这一点。例如,以下命令显示我检测效果大小为 0.2 的最佳样本量是每组有 394 名受访者。
我想说明我有一个两阶段整群抽样策略的事实。例如,选择一组 30 个教室,然后在每个教室中随机抽取 10 名学生进行访谈。如何在功效分析中考虑这种抽样差异?
请注意,这不是类似于集群随机试验 (CRT)的场景。鉴于调查实验的性质,治疗不是在小组层面分配,而是在单位层面分配。换句话说,每个班级都会随机分配经过治疗和控制的学生。
在这种情况下,是否有一种简单直观的方法来运行功率分析?也许指定某种形式的类内相关?
非常感谢你的帮助
machine-learning - 如何改变 FTIR 数据以增加分类模型的样本数量?
我正在尝试进行机器学习来对 FTIR 数据进行分类,但我只得到了大约 50 个 FTIR 数据样本。如果有人知道可以从 50 个样本中制作新数据/假数据(我不确定条款)以增加我的样本量,我想征求意见。如果有一些关于这方面的论文也会非常有帮助。
statistics - a/btesting 样本量计算
我想计算最小样本量或使用二项式度量 X(例如对话率)的 A/B/N 测试。我想使用Student's t test vs Welch t。我知道 welch t 检验适用于不同的方差和不同的组间样本量。给定:mde。预期最小差异:两组 ci 之间的绝对差异。置信水平功率。统计功率 p。对照组的基线转化率 (bcr) N. 包括对照组在内的组数。(默认 N = 2)使用两个样本测试。我们如何计算最小样本量。我知道如何计算比例和 z 分数。
Pooled_prob=(bcr+bcr+mde)/2
min n= (2 * pooled_prob * (1 - pooled_prob) * (Z_beta + Z_alpha)**2 / mde**2)
有人可以在这方面提供帮助吗?
r - 用于比较受限平均生存时间的 R 中三项武装临床试验的样本量估计
我进行了一项包含两种治疗和一种安慰剂的三项武装临床试验。我要比较三者之间的受限平均生存时间。
我需要找到每个手臂的样本量(平均分配)
我知道 R 软件有 survRM2 包,用于计算两次武装试验的 RMST 的样本量。使用的代码是:
library(SSRMST) ssrmst(ac_rate=ac_rate, ac_period=ac_period, tot_time=tot_time, tau=tau, shape0=shape0, scale0=scale0, shape1=shape1, scale1=scale1, margin=margin, seed=seed)
所以,我的问题是,我如何使用这个包来计算三武装试验的样本量(分配相等)。上面的代码将如何修改?
任何指导都会非常有帮助。
python - KNN 样本数不一致
嗨,我正在为 KNN 建模准备一些短信数据。
我正在尝试训练和测试数据。但是我的数据列表的长度似乎只有 1。这很奇怪。当我调用 PRINT 函数时,我可以看到那里的所有文本。
这会导致值错误:“ValueError:找到样本数量不一致的输入变量:[3, 2]”
有没有办法让我确定正确的列表长度?
或者任何人都可以帮我解决我哪里出错了?
提前致谢。
ps 我是学生,刚开始学 Python
代码在这里:
python - 无论Python中的样本量如何,如何绘制一致的概率密度函数(PDF)图?
我有一个关于绘制概率密度函数(PDF)图的问题,无论 Python 中的样本大小如何。
这是我的代码。
这是图表。但是,当我将样本数从 1000 更改为 100 时,例如x = np.random.normal(45, 9, 100)
,图形形状会发生变化。
这是因为缺乏样本量不能代表完全的正态分布。如果我们在 Excel 中绘制一个样本量有限的正态分布图,我们可以发现同样的问题。
但是,在 R 中,stat_function()
无论样本大小如何,始终提供相同形状的正态分布图。
在 R 中,当我运行以下代码时,无论样本大小如何,我都可以获得相同形状的正态分布图。它假设给定均值和标准差的完全正态分布。
你能告诉我如何在 Python 中像 R 一样获得如此一致的正态分布图吗?无论样本大小如何,我都想在 Python 中获得相同形状的正态分布图。
总是,非常感谢!!