问题标签 [binomial-cdf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
10 回答
28067 浏览

algorithm - 如何有效地计算二项式累积分布函数?

假设我知道“成功”的概率是 P。我运行测试 N 次,我看到 S 成功。该测试类似于扔一枚重量不均匀的硬币(也许正面是成功的,反面是失败的)。

我想知道看到 S 次成功或成功次数少于 S 次成功的大致概率。

因此,例如,如果 P 为 0.3,N 为 100,并且我获得 20 次成功,我正在寻找获得 20 次或更少成功的概率。

另一方面,如果 P 为 0.3,N 为 100,并且我获得 40 次成功,我正在寻找获得 40 次更多成功的概率。

我知道这个问题与找到二项式曲线下的区域有关,但是:

  1. 我的数学无法完成将这些知识转化为高效代码的任务
  2. 虽然我知道二项式曲线会给出精确的结果,但我的印象是它本质上是低效的。一种快速计算近似结果的方法就足够了。

我应该强调,这种计算必须很快,并且理想情况下应该可以通过标准的 64 位或 128 位浮点计算来确定。

我正在寻找一个接受 P、S 和 N 并返回概率的函数。由于我更熟悉代码而不是数学符号,因此我希望任何答案都使用伪代码或代码。

0 投票
2 回答
3821 浏览

computer-science - 计算分布式网络中系统故障的概率

我正在尝试建立分布式文件系统中文件可用性的数学模型。我在 MathOverflow 上发布了这个问题,但这也可能被归类为 CS 问题,所以我也在这里试一试。

系统是这样工作的:一个节点在 r*b 个远程节点上存储一个文件(使用纠删码编码),其中 r 是复制因子,b 是一个整数常量。纠删码文件的特性是,如果至少有 b 个远程节点可用并返回文件的一部分,则可以恢复文件。

最简单的方法是假设所有远程节点彼此独立并且具有相同的可用性 p。有了这些假设,文件的可用性遵循二项分布,即二项分布

不幸的是,这两个假设可能会引入不可忽略的错误,如本文所示:http ://deim.urv.cat/~lluis.pamies/uploads/Main/icpp09-paper.pdf 。

克服所有节点具有相同可用性的假设的一种方法是计算可用/不可用节点的每个可能组合的概率,并取所有这些结果的总和(这是他们在上面的论文中建议的那种,只是比我刚才描述的更正式)。您可以将此方法视为深度为 r*b 的二叉树,每个叶子都是可用/不可用节点的一种可能组合。文件的可用性与您在 >=b 个可用节点的情况下到达休假的概率相同。这种方法更正确,但计算成本为鄂尔多. 此外,它不处理节点独立性的假设。

你们有什么好的近似值的想法,它比二项式分布近似引入更少的误差,但计算成本比 更好

您可以假设每个节点的可用性数据是一组由 组成的元组(measurement-date, node measuring, node being measured, succes/failure-bit)。例如,您可以使用此数据计算节点之间的可用性与可用性差异的相关性。

0 投票
1 回答
2183 浏览

algorithm - 如何有效地计算负二项式累积分布函数?

这个帖子真的很有帮助:

如何有效地计算二项式累积分布函数?

(标题 = 如何有效地计算二项式累积分布函数?)

但是,我需要二项式累积分布函数。

有没有办法调整代码以获得累积分布函数?

0 投票
5 回答
2663 浏览

multithreading - 二项式系数

“简单”的问题,计算二项式系数的最快方法是什么?- 一些线程算法?

我正在寻找提示:) - 不是实现:)

0 投票
2 回答
104 浏览

algorithm - 如何生成一系列开启时间遵循二项分布的脉冲?

我有一个简单的问题:

我正在尝试模拟一系列数字脉冲(最大值 = 1,最小值 = 0)。ON-times 的分布应该遵循二项分布。我该怎么做呢?我正在使用 VisualStudio 2012。这是一个非常微不足道的问题,我并不是要浪费任何人的时间,但由于某种原因,当我想到这个问题时,我的大脑无法正常工作。我需要生成一个非常大的数据集(300Mb)。

谢谢!

0 投票
1 回答
651 浏览

r - R:如何更改嵌入在 nbinomTest() 函数中的默认 FDR 值?

我有一张桌子,这是开始:

目标是找到条件“W”和“M”之间的差异表达基因。这是我的代码:

我的问题是:nbinomTest() 函数返回基于 10% FDR 的差异表达基因。有没有办法改变这个数字?我可以在例如 5% FDR 时检查差异表达的基因吗?

0 投票
1 回答
82 浏览

matlab - 对于二项式实验,代码返回最小 m st P(X>m)=1/n^2

假设我们做了一个实验,我们把 n 个球扔进 n 个罐子里。X 是一个自变量,描述了第一个罐子中的球数。构建函数返回满足 P(X>m)<1/n^2 的最小整数。

分布是二项式的,所以我编写了以下 matlab 函数:

但是对于我给它的每一个'n',它都会返回错误或n-1。我究竟做错了什么?

0 投票
0 回答
86 浏览

r - 我如何找到“概率=?” 在这个方程中 pbinom(q=5,size=10,prob=?,lower.tail=FALSE)=.1?

如果我希望 pbinom() 等于特定值并且我假设“q=”和“size=”参数的值,如何解决 pbinom() 的“prob=”参数?假设当我有 q=5、size=10 和 lower.tail=FALSE 时我希望 pbinom() 等于 0.1,是否有确定“prob=”参数应该相等的函数或方法?例如:

通过反复试验,我发现 prob=.3542 已经足够接近了。我知道 qbinom() 是 的倒数pbinom(),但我对找到我想要的 q=5 不感兴趣pbinom()=.1。相反,我想找到“prob =”,因为我知道pbinom(q=5,size=10,prob=?,lower.tail=FALSE)=.1.提前感谢您的帮助。

*对不起,如果这已经在其他地方得到回答。我看了看,没找到。看起来很简单,所以我很惊讶。

0 投票
0 回答
536 浏览

matlab - 计算二项分布 rv 函数的期望值

我正在尝试计算X的函数的期望值,其中X是二项式分布的。所以我想以sum(Pr(X=k)*f(k),k=0,..,n). 现在我想看看值是否随着二叉树的增加而收敛,即如果n增加。然而,对于增加n, ( nover k) 项在Pr(X=k)some 中趋于无穷大k,而函数f(k)=0, 这给出了在 matlabInf*0中产生的乘法。NaN因此结果是NaN

但是,通过以矩阵形式计算类似问题,我知道期望值应该收敛。

所以我的问题是,我该如何处理?

这是我到目前为止的代码(对于一些参数,u~d~0.5. K=s=100

0 投票
1 回答
1055 浏览

matlab - Matlab中的离散概率分布计算

我给出了 P(x1...n) 个离散的独立概率值,它们代表例如发生 X 的可能性。

我想要一个通用代码来解决这个问题:X 以何种概率同时发生 0-n 次?

例如:给定:每辆车(A,B,C)停放的 3 个概率 P(A),P(B),P(C)。问题是:没有车、一车、两车和三车停放的概率是多少?

例如,两辆车同时停放的答案是:

我已经为所有可能性编写了代码,但是我得到的值越多,由于更多可能的组合,它当然会变得越慢。

有人知道加快此功能的方法吗?或者也许 Matlab 有一个实现的功能?


我找到了计算的名称:泊松二项分布