问题标签 [non-uniform-distribution]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Effective Java Item 47: Know and use your libraries - 有缺陷的随机整数方法示例
在 Josh 给出的有缺陷的随机方法的示例中,该方法生成具有给定上限的正随机数n
,我不理解他所说的两个缺陷。
书中的方法是:
- 他说,如果 n 是 2 的小幂,则生成的随机数序列将在短时间内重复。为什么会这样?的文档
Random.nextInt()
说Returns the next pseudorandom, uniformly distributed int value from this random number generator's sequence.
所以不应该是如果 n 是一个小整数那么序列会重复自己,为什么这只适用于 2 的幂? - 接下来他说,如果 n 不是 2 的幂,则平均而言,某些数字将比其他数字更频繁地返回。
Random.nextInt()
如果生成均匀分布的随机整数,为什么会发生这种情况?(他提供了一个代码片段,清楚地证明了这一点,但我不明白为什么会这样,以及这与 n 是 2 的幂有何关系)。
python - 给定比例的随机非均匀分布
我有 3 个标签:“A”、“B”、“C”。
我想生成一个包含 100 个元素的随机列表,其中 60% 是“A”,30% 是“B”,10% 是“C”。
我怎样才能做到这一点?(我是python新手,希望这个问题不要太傻。)
编辑:我的问题与这个问题略有不同: Generate random numbers with a given (numerical) distribution
就像在评论中一样,我希望它们中有 60% 是“A”,并不是每个元素都有 60% 的概率是“A”。所以 numpy.random.choice() 不是我的解决方案。
security - 为什么采用哈希 mod 的盐渍哈希会导致分布非常不均匀?
我有一百万个随机生成的唯一 ID。
如果我做:
然后这似乎导致 ID 均匀分布到 0 到 999 之间的某个整数,每个整数都有大约 1000 个映射到它的 ID。
如果我现在在其中添加一些盐并再次获取哈希:
然后得到的分布是完全不均匀的。对于每个 ID,结果当然在 [0,999] 范围内,但在此范围内的一些整数映射到它们的 ID 为零,而其他整数则有几千个。
为什么这会导致值的分布非常不均匀?
如何调整它以使我的百万个 ID 和任何给定的盐在 [0,999] 范围内均匀分布整数?我想保留将可能非常大的输入空间减少到一些更小的空间(例如大小为 1000)的中间步骤。
我正在使用 SHA-256 哈希。
这是一些 Python 代码,它演示了非常不统一的结果:
matlab - 从传感器数据创建等距数据以应用快速傅里叶变换
我有以下传感器样本数据:
这意味着有时0
我拥有价值0.30865225195884705
,有时60
我拥有价值0.14355185627937317
等等。
正如所观察到的,数据不是等距的,这意味着我有不同时间戳的数据。我需要这个,因为我将对这个信号应用快速傅里叶变换。
是否有任何方法或实现,以便我可以从我的传感器数据创建等距数据?(使用 MATLAB)
python - 使用非规则角度绘制 3D 球面参数曲面
我有一个数据文件,它是数值计算的结果。该文件根据球角r(th, ph)对某个量进行采样。
球面角跨越球体的整个参数表面,但不形成任何明显的网格。为简单起见,假设球面角是随机的。
我想绘制一个拟合这些数据的表面。请注意,我正在绘制的表面不是凸面的。
我已经使用了 matlibplot 和 Mayavi,在所有情况下,我都需要提供我没有的 2D 数组。
c++ - C++ 中 numpy.random.choice 的等效函数
我需要您的帮助来解决以下问题:
c++/opencv 中是否有等效于以下代码的函数:
提前致谢。
cluster-analysis - 用于聚类非正态分布数据的距离度量
我要聚类的数据集由约 1000 个样本和 10 个特征组成,它们具有不同的尺度和范围(负、正、两者)。使用 scipy.stats.normaltest() 我发现没有一个特征是正态分布的(所有 p 值 < 1e-4,小到足以拒绝数据取自正态分布的零假设)。但是我知道的所有距离度量都假设数据是正态分布的(我一直在使用 Mahalanobis,直到我意识到数据是多么不均匀)。在这种情况下会使用什么距离度量?或者这是一个简单地必须标准化每个特征并希望这不会引入偏见的地方?
haskell - Haskell 数据类型的非均匀分布
random包包含一个Uniform
用于均匀分布类型的类型类。这适用于以下类型:
但是假设我想对一组具有非均匀分布的事物进行建模,例如通过添加硬币落在其一侧的可能性:
现在我仍然可以Uniform
在其实现中使用非均匀分布来实现,但这将与Uniform
.
我是否必须只使用一个独立的函数,或者是否有一些类型类用于“实际”分布的概念?
这个类型类在你可以有一些类型的 RPG 上下文中很有用
其中获得 aRare
并且它是 a的机会Sword
可能低于其他值。但是从该类型的所有值的集合中提取一个值的概念仍然是相同的Rarity
,DropType
这就是为什么这对我来说看起来像是类型类的工作。