问题标签 [sample-size]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
5 浏览

statistics - 不同样本量的不同组的统计参数比较

我想比较几个模型的 RMSE、偏差、差异标准差、R2 等统计参数,但是,每个模型的样本量都不同。会对那些统计参数比较产生影响吗?例如,ModelX 有 100 个样本产生 RMSE 0.2,ModelY 有 150 个样本产生 RMSE 0.15。我们可以比较这两个 RMSE 来判断哪个模型更好吗?提前致谢。

0 投票
0 回答
32 浏览

r - 计算集群随机交叉试验的样本量(CRXO 设计)

我正在尝试计算 CRXO 设计的样本量。该研究包括两个干预措施:干预措施 A;和干预 B。将有 N 个集群(研究地点),并且每个集群应该有不同的样本量。每个集群将在不同的时间段内接受两次干预,从而形成“双集群期”。

我阅读了文献,发现为了计算样本量,我需要两条信息:(i)在时期相关性内的集群内(ii)在时期相关性之间的集群内

我怎样才能得到这两个相关性?

0 投票
0 回答
20 浏览

auc - 计算成对 AUC 曲线的协方差

我正在尝试计算两个相关 AUC 之间的协方差,而我所拥有的只是 AUC 的值,而不是源数据。我正在尝试根据Hajian-Tilaki的论文计算样本量。

我查看了Lasko、Bhagwat、Zou 和 Ohno-Machado的论文,但他们要求基于样本量的值,而这正是我想要确定的。

当您只知道 AUC 值(例如 0.8、0.9)时,是否有一种方法(代数或 R)可以确定两个相关 AUC 的协方差?

提前致谢。

0 投票
1 回答
61 浏览

r - 选择每个 bootstrap 样本的样本大小

我有一个数据框,在 29 个变量(列)中有大约 1700 个观察值(行),我必须选择其中 7 个观察值的混合,其中(每个变量的)加权平均值与加权平均值(的1700 个观测值中的每个变量)。我尝试使用 boot() 引导 R 中的数据,目的是获得几种可能的混合物(计算所有可能的混合物需要很长时间),但我未能从整个数据集中仅选择 7 个观察值的样本。我知道自举通常会生成与原始数据集大小相同的样本。这是我尝试过的代码:

0 投票
0 回答
24 浏览

r - Running a Simulation in NLME

I'm trying to create hypothetical parameters to run the following simulation in r;

Can anyone help with hypothetical parameters that I can use to run the model?

0 投票
0 回答
56 浏览

r - 在 R 中对 clmm 使用 powerSim 和 powerCurve 时出错

我是 clmm 的新手,遇到了以下问题:我想使用 powerSim 和 powerCurve 为我的 R 研究获得最佳样本量。因为我的数据是有序的,所以我使用的是 clmm。研究参与者 ( ) 应以 5 点李克特量表 ( )VPN评估三种句子类型 ( SH1SM1和)。我需要将我的参与者视为一个随机因素,而句子类型和评估是我的固定因素。这是我的数据的一瞥(每个参数的 VPN 数量最多为 40,我只是在这里缩短了它):SP1evaluation.likert

现在,在一些帮助下,我创建了以下模型: clmm(likert~parameter+(1|VPN), data=dfdata)

使用这个模型,我正在做模拟:

在上面的例子中,我尝试了 40 名参与者,但我已经运行了一个有 2000000 名参与者的模拟,以检查我是否只需要大量的人。结果是相同的:0.0%。

lastResult()$errors告诉我我正在使用一种不适用于 clmm 的方法: not applicable method for'simulate' on object of class "clmm"

但除了我在这里做的 anova,我也已经尝试过 z、t、f、chisq、lr、sa、kr、pb。(而不是,test=fixed我也已经尝试过test=compare,,,,甚至)test=fcomparetest=rcomparetest=random()

所以我想我的模型一定有问题?或者这些方法真的不适用于 clmms?

非常感谢您的帮助已经非常感谢!

0 投票
0 回答
24 浏览

sas - 多次重复测量的样本量计算

我需要计算表明疾病进展的生物标志物研究的样本量。样本将在基线、12、24、36 和 48 个月时收集,并将针对 15 种 CSF 生物标志物进行测试。已经对 15 名患者进行了一项试点研究,我想将其用作先前的信息。我相信生物标志物是独立的,但也可能存在一些相关性。研究问题是看每个生物标志物的连续测量是否随时间变化。生物标志物值不是正态分布的。我试过G功率软件使用非参数方差分析进行重复测量。我的第一个问题是我是否需要使用 Bonferroni 校正 0.05/15 单独计算每个生物标志物的样本量,然后选择最大的样本量,或者一起计算所有生物标志物的样本量。另一个问题,对于我需要的 g 功率,没有球形校正,epsilon,时间点和 eta 平方之间的相关性,我尝试使用 proc glm 计算它们,如

但是没有得到我想要的。你知道我怎样才能获得这些值,我应该分别假设每个生物标志物的数据吗?

0 投票
2 回答
34 浏览

r - 如何多次模拟不同的样本量并计算每个样本量的总和

这是我的代码:

这是我得到的

如何模拟 1000 次并总结每个 p 的结果。
例如。对于 p=2, s=sum=(2.174076 + 1.410500 )
这样,每个 p 应该有 1000 s 值
非常感谢。

0 投票
0 回答
47 浏览

anova - G*Power:根据给定总体计算样本量

我正在尝试计算 G Power试验所需的样本量。我正在进行一项随机对照试验(3 个测试组 + 对照组 = 4 个组),采用独立测量设计和随机分配。我在 G Power 中输入了这个(见图,ANOVA),输出是 280 个总样本量,这意味着只有 70 个分组,这似乎太低了。尤其是人口为 75,000 人。您能否告知我在 G*Power 中的设置哪里出了问题,以及如何为我的试验获得真实的样本量?

在此处输入图像描述

在此处输入图像描述

0 投票
0 回答
16 浏览

tensorflow - NLP 中计算 dp sgd 隐私的样本数量是多少?

我是新的 TF 隐私用户,并尝试使用compute_dp_sgd_privacy计算隐私预算 epsilon 。

它的变量之一是 N,它被称为“示例总数”。
然后,我很困惑,这是句子单词(标记)的数量吗?

因为在其他一些搜索中,其他人提到示例数与批量大小有关,这认为是一个批量大小中的示例数?

示例、样本、标记之间有什么区别?

谢谢!