问题标签 [binomial-cdf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - 如何有效地计算二项式累积分布函数?
假设我知道“成功”的概率是 P。我运行测试 N 次,我看到 S 成功。该测试类似于扔一枚重量不均匀的硬币(也许正面是成功的,反面是失败的)。
我想知道看到 S 次成功或成功次数少于 S 次成功的大致概率。
因此,例如,如果 P 为 0.3,N 为 100,并且我获得 20 次成功,我正在寻找获得 20 次或更少成功的概率。
另一方面,如果 P 为 0.3,N 为 100,并且我获得 40 次成功,我正在寻找获得 40 次更多成功的概率。
我知道这个问题与找到二项式曲线下的区域有关,但是:
- 我的数学无法完成将这些知识转化为高效代码的任务
- 虽然我知道二项式曲线会给出精确的结果,但我的印象是它本质上是低效的。一种快速计算近似结果的方法就足够了。
我应该强调,这种计算必须很快,并且理想情况下应该可以通过标准的 64 位或 128 位浮点计算来确定。
我正在寻找一个接受 P、S 和 N 并返回概率的函数。由于我更熟悉代码而不是数学符号,因此我希望任何答案都使用伪代码或代码。
computer-science - 计算分布式网络中系统故障的概率
我正在尝试建立分布式文件系统中文件可用性的数学模型。我在 MathOverflow 上发布了这个问题,但这也可能被归类为 CS 问题,所以我也在这里试一试。
系统是这样工作的:一个节点在 r*b 个远程节点上存储一个文件(使用纠删码编码),其中 r 是复制因子,b 是一个整数常量。纠删码文件的特性是,如果至少有 b 个远程节点可用并返回文件的一部分,则可以恢复文件。
最简单的方法是假设所有远程节点彼此独立并且具有相同的可用性 p。有了这些假设,文件的可用性遵循二项分布,即
不幸的是,这两个假设可能会引入不可忽略的错误,如本文所示:http ://deim.urv.cat/~lluis.pamies/uploads/Main/icpp09-paper.pdf 。
克服所有节点具有相同可用性的假设的一种方法是计算可用/不可用节点的每个可能组合的概率,并取所有这些结果的总和(这是他们在上面的论文中建议的那种,只是比我刚才描述的更正式)。您可以将此方法视为深度为 r*b 的二叉树,每个叶子都是可用/不可用节点的一种可能组合。文件的可用性与您在 >=b 个可用节点的情况下到达休假的概率相同。这种方法更正确,但计算成本为. 此外,它不处理节点独立性的假设。
你们有什么好的近似值的想法,它比二项式分布近似引入更少的误差,但计算成本比 更好?
您可以假设每个节点的可用性数据是一组由 组成的元组(measurement-date, node measuring, node being measured, succes/failure-bit)
。例如,您可以使用此数据计算节点之间的可用性与可用性差异的相关性。
multithreading - 二项式系数
“简单”的问题,计算二项式系数的最快方法是什么?- 一些线程算法?
我正在寻找提示:) - 不是实现:)
algorithm - 如何生成一系列开启时间遵循二项分布的脉冲?
我有一个简单的问题:
我正在尝试模拟一系列数字脉冲(最大值 = 1,最小值 = 0)。ON-times 的分布应该遵循二项分布。我该怎么做呢?我正在使用 VisualStudio 2012。这是一个非常微不足道的问题,我并不是要浪费任何人的时间,但由于某种原因,当我想到这个问题时,我的大脑无法正常工作。我需要生成一个非常大的数据集(300Mb)。
谢谢!
r - R:如何更改嵌入在 nbinomTest() 函数中的默认 FDR 值?
我有一张桌子,这是开始:
目标是找到条件“W”和“M”之间的差异表达基因。这是我的代码:
我的问题是:nbinomTest() 函数返回基于 10% FDR 的差异表达基因。有没有办法改变这个数字?我可以在例如 5% FDR 时检查差异表达的基因吗?
matlab - 对于二项式实验,代码返回最小 m st P(X>m)=1/n^2
假设我们做了一个实验,我们把 n 个球扔进 n 个罐子里。X 是一个自变量,描述了第一个罐子中的球数。构建函数返回满足 P(X>m)<1/n^2 的最小整数。
分布是二项式的,所以我编写了以下 matlab 函数:
但是对于我给它的每一个'n',它都会返回错误或n-1。我究竟做错了什么?
r - 我如何找到“概率=?” 在这个方程中 pbinom(q=5,size=10,prob=?,lower.tail=FALSE)=.1?
如果我希望 pbinom() 等于特定值并且我假设“q=”和“size=”参数的值,如何解决 pbinom() 的“prob=”参数?假设当我有 q=5、size=10 和 lower.tail=FALSE 时我希望 pbinom() 等于 0.1,是否有确定“prob=”参数应该相等的函数或方法?例如:
通过反复试验,我发现 prob=.3542 已经足够接近了。我知道 qbinom() 是 的倒数pbinom()
,但我对找到我想要的 q=5 不感兴趣pbinom()=.1
。相反,我想找到“prob =”,因为我知道pbinom(q=5,size=10,prob=?,lower.tail=FALSE)=.1.
提前感谢您的帮助。
*对不起,如果这已经在其他地方得到回答。我看了看,没找到。看起来很简单,所以我很惊讶。
matlab - 计算二项分布 rv 函数的期望值
我正在尝试计算X的函数的期望值,其中X
是二项式分布的。所以我想以sum(Pr(X=k)*f(k),k=0,..,n)
. 现在我想看看值是否随着二叉树的增加而收敛,即如果n
增加。然而,对于增加n
, ( n
over k
) 项在Pr(X=k)
some 中趋于无穷大k
,而函数f(k)=0
, 这给出了在 matlabInf*0
中产生的乘法。NaN
因此结果是NaN
。
但是,通过以矩阵形式计算类似问题,我知道期望值应该收敛。
所以我的问题是,我该如何处理?
这是我到目前为止的代码(对于一些参数,u~d~0.5. K=s=100
)
matlab - Matlab中的离散概率分布计算
我给出了 P(x1...n) 个离散的独立概率值,它们代表例如发生 X 的可能性。
我想要一个通用代码来解决这个问题:X 以何种概率同时发生 0-n 次?
例如:给定:每辆车(A,B,C)停放的 3 个概率 P(A),P(B),P(C)。问题是:没有车、一车、两车和三车停放的概率是多少?
例如,两辆车同时停放的答案是:
我已经为所有可能性编写了代码,但是我得到的值越多,由于更多可能的组合,它当然会变得越慢。
有人知道加快此功能的方法吗?或者也许 Matlab 有一个实现的功能?
我找到了计算的名称:泊松二项分布