问题标签 [cdf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mongodb - 使用 MapReduce 在 MongoDB 中的累积分布
我在 mongodb 中有一组文档,我想计算某些属性的 CDF 并将其返回或存储在数据库中。显然,为每个文档添加一个新属性并不是一个好方法,我可以使用以后可以使用的近似值。这更像是一个理论问题。
因此,我使用 mapreduce 作业计算离散间隔上的 CDF 采样,如下所示(只是算法):
- 获取
count
,min
和max
属性someAttr
- 假设
min = 5
,max=70
,count = 200
. - 在
map()
:for (i=this.someAttr; i < max+1; i++) { emit(i, 1) }
reduce()
只需返回每个键的总和。- 在
finalize()
中,将减少的输出除以记录数:return val / count
。
但是,这确实会输出包含来自 CDF 的样本的集合。
正如您所看到的,这里的间隔步骤是1
,但是这种方法的巨大效率低下是即使从单个文档中也可能会产生大量的发射,即使集合中只有少数文档,因此这显然是不可扩展的,并且不管用。
输出如下所示:
从这里我可以很容易地得到任何值的 CDF 的近似值,如果这是合理的,甚至可以在它们之间进行插值。
有人可以让我深入了解您将如何使用 MapReduce(或者可能没有 MapReduce)计算 CDF(样本)吗?
python - Scipy Weibull CDF 计算
我正在 Scipy 中进行生存计算,但无法获得正确的值。
我的代码:
vals
应该等于 0.085559356392783004,但我得到的是 0。
如果我定义自己的函数,我会得到正确的答案:
我可以只使用我自己的功能,但我很好奇我做错了什么。
r - ggplot:调整 alpha/fill 两个因子 cdf
我在让我的 ggplot alpha 对我的情节足够暗时遇到了一些问题。
示例代码:
如您所见,无论何时carb == 1
,都很难看到情节元素。在我的真实世界数据集中,颜色因子有四个级别,alpha 因子有两个级别。我希望 alpha 的颜色稍微浅一些,但比该示例中的颜色更明显)。
r - 使用 Rstudio 模拟出生 - 绘制 pmf 和 cdf
我有一个小练习要使用 Rstudio 来解决我的统计考试。我试着把它翻译成英文,所以如果有什么不清楚的地方请向我解释。
“模拟 100,000 次出生并使用以下概率:男性 51.3%,女性 48.7%,使用样本函数。
检查获得的男性和女性数量与理论百分比有多少不同。
画出这个实验的概率函数的 PMF 和 CDF(在 50 个出生的样本上)。
计算分布的均值和方差。”
我得到了 51356 个男性和 48644 个女性,相差 56。
但是现在,如何绘制概率函数的 PMF 和 CDF?
这里我放了用来模拟出生的代码:
和结果:
希望有人可以帮助我,我知道对于有 R 经验的人来说这是一个非常简单的问题,但我刚开始使用这种语言。
所以感谢所有愿意回复的人。
编辑:
我试过这段代码:
结果是:
我想我理解的是,作为非常接近 1/2 的概率,在一组 50 名新生儿中,男性人数将非常接近 25。这是什么情节?而且,这是正确的方法吗?
matlab - 截断泊松分布的 CDF
嗨,我正在寻找截断泊松随机变量的累积分布函数。我可以为常规的“poisson cdf”找到它,MATLAB 给出了这个:
p = poisscdf(x,lambda) 使用 lambda 中的相应平均参数返回 x 中每个值的泊松 cdf
是否有截断泊松泊松分布的类似物?
javascript - 这个学生的 t 分布 CDF 计算有什么明显的缺陷吗?
我一直在寻找一个有效的函数来计算学生 t 分布的 CDF(累积分布函数)。
这是我在查看另一个 stackoverflow 问题、JStat 库、此处第 317 行的 the_subtprob 函数后解决的问题。
看了最后参考文献中的注释,我找到了一本绝版书,这没有帮助
如果您对更精确的算法感兴趣,可以查看:StatLib:http ://lib.stat.cmu.edu/apstat/ ;
Griffiths, P. 和 Hill, ID 的应用统计算法
Ellis Horwood:Chichester (1985)
cmu 站点有一个 FORTRAN 函数,我将其翻译如下所示。
查看其他来源,我发现高阶函数,如不完全 beta、log gamma,并且实现似乎更复杂,并且在一种情况下是迭代的。
我想知道这个实现是否有任何已知的缺陷。它似乎产生与其他结果相同的结果。关于如何评估这一点的任何想法也会有所帮助。
matplotlib - matplotlib 一个图中的多个情节奇怪的发生
我试图在一个图中绘制分布 pdf 和 cdf。如果一起绘制,则 pdf 和 cdf 不匹配。如果单独绘制,它们将匹配。为什么?您可以从同一个方程看到两条绿色曲线,但显示不同的形状......
c++ - C++ 中对数正态分布的累积函数的逆
我正在寻找 C++ 中的函数实现(或库),它可以计算对数正态分布的累积函数的逆值。我没有运气找到它。
任何帮助将不胜感激!
python-2.7 - 累积分布函数(超几何)
我需要找出如何计算“超几何 cdf”:
我知道函数的外观和工作原理,但是将函数放入 python 时遇到一些问题:
问题是,如何将 sum 函数从 i 集成到 x?我用 sum(range(x+1)) 试过了,但它不起作用。
statistics - Mathematica:难以使用多重正态分布和 InverseCDF 函数
我正在努力使用 MultivariateStatistics 包中的函数 MultinormalDistribution 和 InverseCDF。本质上
输出是
有人可以更正上面的代码吗?如果我理解正确的话,delta 应该是一个数字。