Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有 400,000 行,每行都有一个 id、试验次数和成功次数。
我有(一个)p 值,一个假设的成功概率。
我想使用其试验成功和全局 p 为每一行计算一个精确的、二项式、单边 p 值。
例如,
1001 10 2
应该给我
1001 10 2 2.639011e-01 表示 2 次或更多成功的概率。
我更喜欢 SAS 中的解决方案,但 SPSS 也很有用。
谢谢!
您可以直接使用二项分布:
data yourdata; set yourdata; p_lower = PROBBNML(globalp, ntrials, nsuccesses); p_higher = 1 - PROBBNML(globalp, ntrials, nsuccesses-1); run;
我尚未测试 PROBBNML 是否适用于 -1 响应,因此您可能需要nsuccesses=0在使用p_higher公式之前进行测试。
nsuccesses=0
p_higher