问题标签 [sample-size]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R:用蒙特卡罗计算 pi 近似的近似误差
我是计算机模拟和 R 编程的新手,这是我必须在大学学习的一个新模块 我在理解练习中提出的问题时遇到了一些问题
我正在尝试的代码:
变量“运行”是否被视为练习中的样本量?在此先感谢您的帮助
longitudinal - 具有独立测量的多个组的样本量计算
因此,4 组 3 个时间点有 360 个数据点。时间不重复。基本上,想象 10 颗牙齿并将它们分成 4 块,每块在时间点 (1,2,3) 测量,所有牙齿都这样做。
我想计算功率,然后根据给定的功率进行样本大小。
样本数据
r - ctree CART 条件树中的权重与权重 (party::ctree)
条件购物车中的“权重”和“权重”是什么?
我正在使用 CARTS 通过递归分区来分析一个小数据集(N=70)。具体来说,ctree 函数形成了 R 中的派对包。
我对什么是“权重”和“权重”有点困惑。据我了解,他们将每个节点的最终观察次数称为“权重”。但是,也可以将“权重”设置为具有条件树的模型中的重要性度量,我称之为“统计权重”。
我将一个分类变量设置为“统计权重”,我不确定软件在后面做什么,但是每个节点的样本大小(N =“权重”)突然比初始值大 5.5 倍(N = 400)一,总样本量(N = n1+n2+n3..))取决于最小桶和最大深度。我认为该模型只会考虑此类变量的可重复性并在模型中对其进行权衡。我理解为什么节点的样本大小会有所不同,但我没想到总 N 是可变的。
我已经多次阅读了patry手册,还尝试了partykit包。我读了又读,这些概念可能得到了解释,但是在推理树中添加“统计权重”时,我对获得如此大的样本量(“权重”)感到困惑。
experimental-design - 实验设计的样本量计算
我有三种治疗方法(野生型,Mutant1 和 Mutant2);我要求输入有关如何确定具有高统计功效(1-beta=0.8)的具有统计学意义(alpha <0.05)的样本量。
问题
我知道我们需要效果大小的信息。如果我们事先不知道预期的效果大小,我们就会解决这个问题;估计效应大小的试验实验。在这种情况下,如果我们想通过试验来估计效果大小;开始的样本量是多少;高(n=10)还是低至 n=3?治疗中的 n = 3 能否提供对效应大小的良好估计,或者 n = 10 更好地得到这个估计。让我们具体一点;如果我们有最大 n=10 的资源。我们可以选择在 n=3 或 n=10 之间进行试验
python - 使用幂方差计算样本量计算的 `eta`
我pingouin.power_anova(eta=None, k=None, n=None, power=None, alpha=0.05)
在 python 中用于计算样本量。我有关于control_group_historic_mean
和control_group_historic_std_deviation
的信息minimum_detectable_effect
。eta
我从这里读到了关于的定义。但无法弄清楚我应该如何使用给定的信息来计算eta
。
对不起,如果我遗漏了一些基本的东西,我是统计新手。
survival-analysis - 基于中位事件发生时间的单臂研究的样本量
在我的硕士论文中,我需要确定和计算事件发生时间的中位数。该方法是根据 Brookmeyer & Crowley, 1982。我的问题是:如何根据 Brookmeyer 确定样本量?因此,确定中位事件发生时间的案例数量。如何定义 N 的方程?我知道如何计算置信区间,但我的问题是,我如何从理论上确定案例编号。
编辑:
“设计具有不同特征的试验:计划一个没有历史对照的单臂研究。如何确定样本量N,哪种方法最好”,这是我的计划。假设“事件中位时间“PFS”“。我想确定样本量 N 然后计算它,这就是为什么我认为我可以清楚地使用或找到 N 的公式。我坚信生存时间是指数分布的我想用它看到:1-样本量基于分布假设?2-没有可用的实现?如何得出p值?感谢您的进一步帮助,最好的问候
statistics - 样本量的正确计算方法是什么?
我们总共有大约 5000 万用户,并且希望在将产品推广给所有人之前在一个子组中测试产品。我们预计子组的平均值为 45,标准差为 5。现在的问题是,我们应该为子组设置什么大小,以便他们代表总 5000 万用户?我读过关于使用 ((Zα/2)/MOE)^2 xpxq 来估计未知总体标准差的样本量,但公式中使用的指标是比例,而我的指标是连续指标(均值,标准差)。我应该使用什么公式来计算样本量?谢谢!
statistics - 样本量和置信区间?
我希望我的样本代表的人群是 8.189.892,年龄在 18 到 100 岁之间。我希望置信度为 95%。由于我有点初学者,我有一些问题:
- 我是否必须确保在我的样本中,每个年龄(18-100 岁以上)的受访者数量相同才能具有代表性?
1a) 地理因素有影响吗?我的意思是,我是否需要确保每个年龄段的受访者数量相同,来自该国的各个部分(例如,市或县)?
- 我必须有置信区间才能计算我的样本量吗?还是我需要先确定样本量才能计算置信区间?
干杯,
维克多
linear-regression - 多元线性回归的事后功效分析
我进行了一项研究,以检查药物依从性水平(连续变量)及其与不同变量(分类变量)的关联。我使用以下等式计算了样本量:n = N z2 p q / d2 (N-1) +z2 p问。z = 1.96,95% CI,人口规模为 13600(基于已发表的报告)。将高依从性人群的百分比设置为 50%,以获得 374 个最大样本量,以 95% 的概率测量高依从性的比例和 5% 的精度。但是,计算的样本量增加到 450,因为预计电话号码无效、无法使用、不愿意参与以及电话号码所有权的变化(数据收集是通过电话收集的)。只有 180 人符合纳入标准并被纳入。
后来我收到了一项建议进行事后功效分析,因为我的研究动力不足。当我使用 G*power 软件执行此操作时,我的功率为 0.9998377。有这个值可以吗?
我用 10 个预测变量和 0.226 的调整 R 平方进行了多元线性回归