问题标签 [probability]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
6 回答
2590 浏览

c - 如何生成与直方图匹配的点?

我正在研究一个模拟系统。我很快就会有几个模拟输入值的真实世界分布的实验数据(直方图)。

当模拟运行时,我希望能够产生与测量分布相匹配的随机值。我宁愿这样做而不存储原始直方图。有什么好的方法

  1. 将直方图映射到一组代表分布的参数?
  2. 在运行时生成基于这些参数的值?

编辑:输入数据是几种不同类型事件的事件持续时间。我期望不同的类型会有不同的分布函数。

0 投票
5 回答
23670 浏览

java - 哪个 java 库计算累积标准正态分布函数?

对于一个项目,我有一个带有公式的规范,我必须实施。在这些公式中,存在累积标准正态分布函数,它采用浮点数并输出概率。该函数用 Φ 表示。是否存在计算此函数的 Java 库?

0 投票
5 回答
12627 浏览

math - 排列组合面试

这是一个很好的方法,因为它非常违反直觉:

想象一个装满球的瓮,其中三分之二是一种颜色,三分之一是另一种颜色。一个人从瓮中抽出 5 个球,发现其中 4 个是红色的,1 个是白色的。另一个人抽了20个球,发现12个是红色的,8个是白色的。两个人中的哪一个应该更确信骨灰盒中有三分之二的红球和三分之一的白球,而不是相反?每个人应该给出什么赔率?

我知道正确的答案,但也许我不太了解赔率计算。谁能解释一下?

0 投票
3 回答
280 浏览

math - 从采样的用户名中推断网站用户群规模的方法

假设您想估计一个不公开此信息的站点的用户群规模。

人们更有可能以不同的概率获得不同的用户名。例如,如果系统上不存在用户名“nick”,则它的用户群可能非常小。如果使用用户名“starbaby”,它可能是一个更大的站点。这似乎是一个简单的贝叶斯问题。

存在不同站点可能具有不同的允许用户名空间的问题。我想最大的问题是空格等常见字符的合法性。另一个可能影响之前发布的问题是,网站是否会在你想要的名字被取走时建议名字,或者让你自己想一个更有创意的名字。

您如何建立一个跨不同规模系统的用户名出现频率的训练集?有没有办法使用贝叶斯进行数值估计而不是分类到固定宽度的桶中?

0 投票
7 回答
43866 浏览

python - 如何模拟有偏硬币的翻转?

在无偏硬币翻转中,H 或 T 出现 50% 的次数。

但我想模拟硬币,它给出概率为“p”的 H 和概率为“(1-p)”的 T。

像这样的东西:

0 投票
10 回答
16183 浏览

python - 如何在 python 中模拟偏向模具?

我想模拟 N 面偏压芯片?

0 投票
9 回答
11356 浏览

algorithm - 确定掷骰子中出现的数字的频率

对于一个游戏,我试图确定某个 # 将出现在给定的骰子 # 中出现的频率。我知道……这个问题似乎很奇怪。让我试着用实数来解释它。

因此,对于 1 个骰子,每个数字的频率将相同。1-6 将出现相同的次数。

现在对于 2 个骰子,情况会有所不同。我想 5,6,7 将是最常滚动的,而频谱两端的数字将显示较少或根本不显示(在 1 的情况下)。我想知道如何计算这个列表并以正确的顺序显示它们,从最频繁到不太频繁。

有什么想法吗?


@duffymo - 虽然有某种算法来提出它会非常好。似乎上述方式将需要大量的手工挑选和放置数字。如果我的骰子数是动态的,最多可以说 10,那么我认为手工操作将是低效且麻烦的。:)

0 投票
12 回答
20570 浏览

python - Python中的概率分布

我有一堆键,每个键都有一个似然变量。我想随机选择其中一个键,但我希望不太可能(键、值)被选择而不是不太可能(更可能)的对象。我想知道您是否有任何建议,最好是我可以使用的现有 python 模块,否则我需要自己制作。

我已经检查了随机模块;它似乎没有提供这个。

我必须为 1000 组不同的对象做出数百万次这样的选择,每组包含 2,455 个对象。每个集合将相互交换对象,因此随机选择器需要是动态的。1000组2433个对象,即24.33亿个对象;低内存消耗至关重要。由于这些选择不是算法的主体,我需要这个过程非常快;CPU时间是有限的。

谢谢

更新:

好的,我试图明智地考虑您的建议,但时间是如此有限......

我查看了二叉搜索树方法,它似乎太冒险(复杂而复杂)。其他建议都类似于 ActiveState 配方。我拿了它并对其进行了一些修改,以期提高效率:

我希望通过动态保持确定性和最大确定性的总和来提高效率。欢迎任何进一步的建议。你们为我节省了很多时间和精力,同时提高了我的效率,这太疯狂了。谢谢!谢谢!谢谢!

更新2:

我决定让它一次选择更多的选择来提高它的效率。这将在我的算法中导致可接受的精度损失,因为它本质上是动态的。无论如何,这就是我现在所拥有的:

我还没试过。如果您有任何意见/建议,请不要犹豫。谢谢!

更新3:

我整天都在研究 Rex Logan 答案的任务定制版本。它实际上是一个特殊的字典类,而不是 2 个对象和权重数组;这使得事情变得相当复杂,因为 Rex 的代码会生成一个随机索引......我还编写了一个测试用例,它类似于我的算法中会发生的事情(但在我尝试之前我真的不知道!)。基本原则是:一个密钥被随机生成的次数越多,它再次生成的可能性就越小:

仍然欢迎任何意见。@Darius:你的二叉树对我来说太复杂太复杂了;而且我不认为它的叶子可以有效地去除......谢谢所有

0 投票
5 回答
1613 浏览

unit-testing - 测试概率函数

我需要一个以随机顺序返回数组的函数。我想确保它是随机的,但我不知道如何编写测试以确保数组确实是随机的。我可以多次运行代码,看看我是否多次得到相同的答案。虽然大型阵列不太可能发生冲突,但小型阵列(例如两个元素)很可能发生冲突。

我应该怎么做?

0 投票
3 回答
441 浏览

statistics - 结合联合概率

我正在尝试计算概率分布的表达式(与生物信息学相关),并且在组合来自两个不同来源的随机变量的信息时遇到了麻烦。本质上,这里是这样的场景:有 3 个离散随机变量 X、A 和 B。X 依赖于 A 和 B。A 和 B 仅通过 X 相关,即 A 和 B 在给定 X 的情况下是独立的。现在,我得出了表达式:P(X, A) 和 P(X, B)。我需要计算 P(X, A, B) - 这不是链式法则的直接应用。

由于 P(A) 可用,我可以从第一个表达式中推导出 P(X | A)。B 从未独立于 A 被观察到,P(B) 并不容易获得 - 充其量我可以通过边缘化 A 来近似它,但表达式 P(A, B) 没有封闭形式,因此整合很棘手。

关于如何在不丢弃信息的情况下导出 P(X, A, B) 的任何想法?提前谢谢了。

阿米特