问题标签 [sample-size]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
13 浏览

hierarchical-clustering - 在 R 中使用 wp.crt2arm 命令进行集群随机试验设计的样本大小和集群大小

我正在尝试使用 wp.crt2arm 计算集群大小,但在尝试执行代码时遇到以下错误: wp.crt2arm(f=0.25, n=15, icc=0.1, alpha=0.05, power=0.80,替代=c(“双面”))

错误:nuniroot(function(J) eval(p.body) - power, ifelse(is.null(interval), 中的错误:请提供一个包含两个值的区间,例如 c(0,1)。

任何人都可以帮助解决这个问题。谢谢!

0 投票
0 回答
16 浏览

r - 两阶段聚类抽样的功效计算

我正在尝试R为调查实验做一些功率计算。

我知道如何使用pwr命令来做到这一点。例如,以下命令显示我检测效果大小为 0.2 的最佳样本量是每组有 394 名受访者。

我想说明我有一个两阶段整群抽样策略的事实。例如,选择一组 30 个教室,然后在每个教室中随机抽取 10 名学生进行访谈。如何在功效分析中考虑这种抽样差异?

请注意,这不是类似于集群随机试验 (CRT)的场景。鉴于调查实验的性质,治疗不是在小组层面分配,而是在单位层面分配。换句话说,每个班级都会随机分配经过治疗和控制的学生。

在这种情况下,是否有一种简单直观的方法来运行功率分析?也许指定某种形式的类内相关?

非常感谢你的帮助

0 投票
0 回答
10 浏览

machine-learning - 如何改变 FTIR 数据以增加分类模型的样本数量?

我正在尝试进行机器学习来对 FTIR 数据进行分类,但我只得到了大约 50 个 FTIR 数据样本。如果有人知道可以从 50 个样本中制作新数据/假数据(我不确定条款)以增加我的样本量,我想征求意见。如果有一些关于这方面的论文也会非常有帮助。

0 投票
1 回答
33 浏览

r - 使用第二个轴显示分组数据的样本大小。无法正确设置间距,因此点图与基础 R 中的分组条对齐

我对数据进行了分组,其中每个条形都有不同的样本量,范围从 0 样本到 >600。对于不同的数据,我希望再有 2 个相同图表的面板,如果我只是在每个条形上方写下样本大小,这将使它非常拥挤/难以阅读。

我决定制作第二个轴并将样本大小绘制为条形图上的点图。但是我无法得到它,所以点在条上对齐。我尝试调整条形的宽度以及分组条形和条形组之间的间距。并且为点图设置的间距应该与这些宽度/间距相同(参见 verts)。但它显然不是(见下面链接的照片)。有谁知道出了什么问题?有什么解决办法还是我应该继续尝试用不同的方式来传达样本量?

这是我用来绘制图形的代码的精简版本以及它现在的样子。

在此处输入图像描述

可重现的代码:

0 投票
0 回答
10 浏览

statistics - a/btesting 样本量计算

我想计算最小样本量或使用二项式度量 X(例如对话率)的 A/B/N 测试。我想使用Student's t test vs Welch t。我知道 welch t 检验适用于不同的方差和不同的组间样本量。给定:mde。预期最小差异:两组 ci 之间的绝对差异。置信水平功率。统计功率 p。对照组的基线转化率 (bcr) N. 包括对照组在内的组数。(默认 N = 2)使用两个样本测试。我们如何计算最小样本量。我知道如何计算比例和 z 分数。 Pooled_prob=(bcr+bcr+mde)/2

min n= (2 * pooled_prob * (1 - pooled_prob) * (Z_beta + Z_alpha)**2 / mde**2)

有人可以在这方面提供帮助吗?

0 投票
0 回答
22 浏览

r - 用于比较受限平均生存时间的 R 中三项武装临床试验的样本量估计

我进行了一项包含两种治疗和一种安慰剂的三项武装临床试验。我要比较三者之间的受限平均生存时间。

我需要找到每个手臂的样本量(平均分配)

我知道 R 软件有 survRM2 包,用于计算两次武装试验的 RMST 的样本量。使用的代码是:

library(SSRMST) ssrmst(ac_rate=ac_rate, ac_period=ac_period, tot_time=tot_time, tau=tau, shape0=shape0, scale0=scale0, shape1=shape1, scale1=scale1, margin=margin, seed=seed)

所以,我的问题是,我如何使用这个包来计算三武装试验的样本量(分配相等)。上面的代码将如何修改?

任何指导都会非常有帮助。

0 投票
0 回答
7 浏览

python - KNN 样本数不一致

嗨,我正在为 KNN 建模准备一些短信数据。

我正在尝试训练和测试数据。但是我的数据列表的长度似乎只有 1。这很奇怪。当我调用 PRINT 函数时,我可以看到那里的所有文本。

这会导致值错误:“ValueError:找到样本数量不一致的输入变量:[3, 2]”

有没有办法让我确定正确的列表长度?

或者任何人都可以帮我解决我哪里出错了?

提前致谢。

ps 我是学生,刚开始学 Python

代码在这里:

0 投票
0 回答
24 浏览

python - 无论Python中的样本量如何,如何绘制一致的概率密度函数(PDF)图?

我有一个关于绘制概率密度函数(PDF)图的问题,无论 Python 中的样本大小如何。

这是我的代码。

在此处输入图像描述

这是图表。但是,当我将样本数从 1000 更改为 100 时,例如x = np.random.normal(45, 9, 100),图形形状会发生变化。

在此处输入图像描述

这是因为缺乏样本量不能代表完全的正态分布。如果我们在 Excel 中绘制一个样本量有限的正态分布图,我们可以发现同样的问题。

但是,在 R 中,stat_function()无论样本大小如何,始终提供相同形状的正态分布图。

在 R 中,当我运行以下代码时,无论样本大小如何,我都可以获得相同形状的正态分布图。它假设给定均值和标准差的完全正态分布。

你能告诉我如何在 Python 中像 R 一样获得如此一致的正态分布图吗?无论样本大小如何,我都想在 Python 中获得相同形状的正态分布图。

总是,非常感谢!!

在此处输入图像描述