1

power.prop.test 的电源部分是否有行业标准?

我正在使用该功能查找 p2 但不确定功率标准是什么。

power.prop.test(
  n= 6289195,
  p1=0.004, 
  power=0.8, 
  sig.level=0.05, 
  tol=.Machine$double.eps^.8)

例如,应该是0.8还是0.9

4

1 回答 1

2

这是一个实用的统计问题,而不是 R 问题,但 0.8 的幂,即 80%,是常见的。由于它很常见(相当像 95% 的置信度),人们认为他们理解它在说什么,并且不会像可能其他值那样质疑它的选择。

你需要记住它是一个任意的目标:如果你在你的例子中改变了它,那么主要的影响就是给你一个不同的结果p2。确实,您应该明确平衡增加样本量的成本与 I 类错误和特定 II 类错误的不同成本

一个常见的参考是 Cohen J. (1988)。行为科学的统计功效分析。纽约,纽约:Routledge Academic,第 2.4 节,其中说:

这里建议作为一个惯例,当调查人员没有其他基础来设置所需的功率值时,使用 0.80 的值。这意味着 b 设置为 0.20。提供这种任意但合理的值有几个原因(Cohen, 1965, pp. 98-99)。其中最主要的是考虑到 0.05 的隐含约定。选择 .20 的 b 是因为这两种错误的一般相对严重性约为 0.20/.05,即 I 类错误的严重程度是 II 类错误的四倍错误。提供这种 0.80 的期望功率约定是希望当调查人员能够在他的具体研究调查中找到其实质性关注的基础来选择一个特设值时,它会被忽略。

在快速搜索中找到 0.8 的其他示例:

  • power.prop.test的R stats 参考页用作power=0.8示例
  • 渥太华大学的医学页面“通常选择 80% 的功效;因此 20% 的时间会错过真正的差异。这是一种折衷方案,因为将功效提高到 90% 的功效将需要将样本量增加约 30 %"
  • Statistics Done Wrong网站和书上说:“科学家可能想知道需要多少患者来测试一种新药物是否可以将生存率提高 10% 以上,而快速计算统计功效将提供答案。科学家通常很满意“当统计功效为 0.8 或更高时,相当于 80% 的机会得出结论确实有效果。但是,很少有科学家进行过这种计算,也很少有期刊文章提到他们测试的统计功效。”
于 2018-08-28T22:05:01.010 回答