问题标签 [sample-size]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
statistics - 不同样本量的不同组的统计参数比较
我想比较几个模型的 RMSE、偏差、差异标准差、R2 等统计参数,但是,每个模型的样本量都不同。会对那些统计参数比较产生影响吗?例如,ModelX 有 100 个样本产生 RMSE 0.2,ModelY 有 150 个样本产生 RMSE 0.15。我们可以比较这两个 RMSE 来判断哪个模型更好吗?提前致谢。
r - 计算集群随机交叉试验的样本量(CRXO 设计)
我正在尝试计算 CRXO 设计的样本量。该研究包括两个干预措施:干预措施 A;和干预 B。将有 N 个集群(研究地点),并且每个集群应该有不同的样本量。每个集群将在不同的时间段内接受两次干预,从而形成“双集群期”。
我阅读了文献,发现为了计算样本量,我需要两条信息:(i)在时期相关性内的集群内(ii)在时期相关性之间的集群内
我怎样才能得到这两个相关性?
auc - 计算成对 AUC 曲线的协方差
我正在尝试计算两个相关 AUC 之间的协方差,而我所拥有的只是 AUC 的值,而不是源数据。我正在尝试根据Hajian-Tilaki的论文计算样本量。
我查看了Lasko、Bhagwat、Zou 和 Ohno-Machado的论文,但他们要求基于样本量的值,而这正是我想要确定的。
当您只知道 AUC 值(例如 0.8、0.9)时,是否有一种方法(代数或 R)可以确定两个相关 AUC 的协方差?
提前致谢。
r - 选择每个 bootstrap 样本的样本大小
我有一个数据框,在 29 个变量(列)中有大约 1700 个观察值(行),我必须选择其中 7 个观察值的混合,其中(每个变量的)加权平均值与加权平均值(的1700 个观测值中的每个变量)。我尝试使用 boot() 引导 R 中的数据,目的是获得几种可能的混合物(计算所有可能的混合物需要很长时间),但我未能从整个数据集中仅选择 7 个观察值的样本。我知道自举通常会生成与原始数据集大小相同的样本。这是我尝试过的代码:
r - Running a Simulation in NLME
I'm trying to create hypothetical parameters to run the following simulation in r;
Can anyone help with hypothetical parameters that I can use to run the model?
r - 在 R 中对 clmm 使用 powerSim 和 powerCurve 时出错
我是 clmm 的新手,遇到了以下问题:我想使用 powerSim 和 powerCurve 为我的 R 研究获得最佳样本量。因为我的数据是有序的,所以我使用的是 clmm。研究参与者 ( ) 应以 5 点李克特量表 ( )VPN
评估三种句子类型 ( SH1
、SM1
和)。我需要将我的参与者视为一个随机因素,而句子类型和评估是我的固定因素。这是我的数据的一瞥(每个参数的 VPN 数量最多为 40,我只是在这里缩短了它):SP1
evaluation.likert
现在,在一些帮助下,我创建了以下模型:
clmm(likert~parameter+(1|VPN), data=dfdata)
使用这个模型,我正在做模拟:
在上面的例子中,我尝试了 40 名参与者,但我已经运行了一个有 2000000 名参与者的模拟,以检查我是否只需要大量的人。结果是相同的:0.0%。
lastResult()$errors
告诉我我正在使用一种不适用于 clmm 的方法:
not applicable method for'simulate' on object of class "clmm"
但除了我在这里做的 anova,我也已经尝试过 z、t、f、chisq、lr、sa、kr、pb。(而不是,test=fixed
我也已经尝试过test=compare
,,,,甚至)test=fcompare
test=rcompare
test=random()
所以我想我的模型一定有问题?或者这些方法真的不适用于 clmms?
非常感谢您的帮助已经非常感谢!
sas - 多次重复测量的样本量计算
我需要计算表明疾病进展的生物标志物研究的样本量。样本将在基线、12、24、36 和 48 个月时收集,并将针对 15 种 CSF 生物标志物进行测试。已经对 15 名患者进行了一项试点研究,我想将其用作先前的信息。我相信生物标志物是独立的,但也可能存在一些相关性。研究问题是看每个生物标志物的连续测量是否随时间变化。生物标志物值不是正态分布的。我试过G功率软件使用非参数方差分析进行重复测量。我的第一个问题是我是否需要使用 Bonferroni 校正 0.05/15 单独计算每个生物标志物的样本量,然后选择最大的样本量,或者一起计算所有生物标志物的样本量。另一个问题,对于我需要的 g 功率,没有球形校正,epsilon,时间点和 eta 平方之间的相关性,我尝试使用 proc glm 计算它们,如
但是没有得到我想要的。你知道我怎样才能获得这些值,我应该分别假设每个生物标志物的数据吗?
r - 如何多次模拟不同的样本量并计算每个样本量的总和
这是我的代码:
这是我得到的
如何模拟 1000 次并总结每个 p 的结果。
例如。对于 p=2, s=sum=(2.174076 + 1.410500 )
这样,每个 p 应该有 1000 s 值
非常感谢。
tensorflow - NLP 中计算 dp sgd 隐私的样本数量是多少?
我是新的 TF 隐私用户,并尝试使用compute_dp_sgd_privacy计算隐私预算 epsilon 。
它的变量之一是 N,它被称为“示例总数”。
然后,我很困惑,这是句子或单词(标记)的数量吗?
因为在其他一些搜索中,其他人提到示例数与批量大小有关,这认为是一个批量大小中的示例数?
示例、样本、标记之间有什么区别?
谢谢!