问题标签 [bernoulli-probability]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - bernoulli_distribution 与 uniform_int_distribution
在比较bernoulli_distribution
s 的默认构造函数(真/假的可能性为 50/50)和uniform_int_distribution{0, 1}
(0 或 1 的均匀可能性)时,我发现bernoulli_distribution
s 的速度至少比它们慢2 倍和 6 倍以上,uniform_int_distribution
尽管它们给出了相同的结果。
我希望bernoulii_distribition
表现更好,因为它是专门为只有两种结果(真或假)的概率而设计的;然而,事实并非如此。
鉴于上述和以下的性能指标,伯努利分布在 uniform_int_distributions 上是否有实际用途?
超过 5 次运行的结果(发布模式,x64 位):(请参阅下面的编辑以了解未附加调试器的发布运行)
分析代码:
编辑
我在没有附加调试符号的情况下重新运行了测试,但 bernoulli 的运行速度仍然慢了 4 倍:
bernoulli-probability - 二项式(伯努利)试验:在给定概率 p 的情况下,需要多少次试验才能达到 n 次成功?
这似乎是一个基本问题,但我遇到了麻烦。n
给定概率p
,在 95% 的置信度下,我需要多少次试验才能取得成功?我试过qbiom()
了,但我现在很确定这是错误的选择。
python - 在 Python Pomegranate 中,如何创建具有伯努利分布的贝叶斯模型?
我正在尝试使用伯努利分布在石榴中创建贝叶斯模型,但我不知道如何构建分布并创建条件表。我已经看到了石榴的 Monty Hall 示例,并试图效仿它。以下是我对此事的看法:
这给了我以下错误:
python - 为什么 Tensorflow 伯努利分布总是返回 0?
我正在根据单词出现对文本进行分类。其中一个步骤是估计每个可能类别的特定文本的概率。为此,我从 NFEATURES 单词的词汇表中获得了 NSAMPLES 文本,每个都标有 NLABELS 类标签之一。由此,我构造了一个二进制出现矩阵,其中 entry(sample,feature) 为 1 iff 文本“sample”包含由“feature”编码的单词。
从出现矩阵中,我们可以构造一个条件概率矩阵,然后对其进行平滑处理,使概率既不是 0.0 也不是 1.0,使用以下代码(从 Coursera 笔记本复制):
要查看问题,这里是模拟输入并调用结果的代码:
当我执行此操作时,我得到:
也就是说,所有的概率都是零。这里的某些步骤不正确,您能帮我找到吗?
python - 使用 scipy.stats.bernoulli 模拟 1/3 概率
我们的任务是重新创建著名的公平硬币翻转 (p=0.5),仅使用bernoulli.rvs()
生成具有均匀离散分布的函数(结果 = 0,1,2)。是否可以只使用伯努利函数形式scipy.stats
?
probability - 设计一个实验,从 100 个硬币中找出不公平的硬币
假设有 100 个硬币,其中只有 1 个硬币是不公平的。这个不公平的硬币得到正面的概率小于 0.5。我如何设计一个实验来找到不公平的硬币?
我认为一种方法是多次翻转每个硬币(例如,10000 次)。然后将挑选正面数量最少的硬币作为不公平硬币。但是还有其他更聪明的方法可以做到这一点吗?
python - 从指数伯努利抽样
伯努利是一个概率分布。我需要从指数伯努利采样并返回一个二进制值(即 0 或 1)。我发现了这个算法指数伯努利采样
,我想实现它,但我不明白算法的第 3 步,其中:
r1 = r1 & (2^h - 1 )
。有人可以帮忙吗?
statistics - 调查回复可以是随机变量吗?
我正在尝试分析调查的回复。结果变量名为“reading_proficiency”,具有两个值 0 和 1。数据集有 3,539 个观察值,因此“reading_proficiency”列有 0 或 1 的 3,539 个观察值。
我想了解我是否可以在这里使用二项分布的想法。变量“reading_proficiency”可以是随机变量吗?
我使用的随机变量的定义如下。随机变量是随机决定的具有不同值的变量。换句话说,它是一个随机变化的数值。
“reading_proficiency”的值真的是偶然决定的吗?对“reading_proficiency”的两个观察真的相互独立吗?
如果两个观察来自同一个调查集群,他们可能就读于同一所学校,由同一位教师教授,因此具有相同的“reading_proficiency”。
许多观察来自同一个集群的事实是否会取消“reading_proficiency”作为随机变量的资格?
我在读到“reading_proficency”的每个观察都应该是相互独立的,但调查数据并非如此,或者......?
这是否意味着调查数据不能是随机变量?