问题标签 [random-sample]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 来自未知概率分布的样本
我有一个长度约为 100k 的向量,其值介于 0 和 1 之间,表示地理位置的栖息地适宜性。虽然有些值非常小,但其中许多是 0.9 等,因此总和远大于 1。
我想生成 1000 个随机位置样本,每个样本的长度为 6(没有替换),选择一个位置的概率由该位置的向量值加权。
下面的虚拟数据。有任何想法吗?
bash - Shell脚本随机数生成
var=$RANDOM
创建随机数,但我如何指定一个介于 0 到 12 之间的范围?
algorithm - 如何从联合、离散、概率分布函数中进行数值采样
我有一个需要通过随机采样重新创建的 2D“热图”或 PDF。IE 我有一个显示起始位置的二维概率密度图。我需要随机选择与原始 PDF 具有相同概率的起始位置。
为此,我想我需要先找到联合 CDF(累积密度函数),然后选择随机均匀数对 CDF 进行采样。这就是我卡住的地方。
如何以数字方式找到我的 PDF 的联合 CDF?我尝试在两个维度上进行累积求和,但这并没有产生正确的结果。我的统计知识让我失望了。
编辑热图/PDF 是 [x,y,z] 的形式,其中 Z 是每个 x,y 点的强度或概率。
c# - 一种选择特定随机名称的方法
我正在开发一个 Windows 应用程序。这个应用程序包含一个动态的名称列表,以表格形式显示(用户可以添加或删除某个名称)。我想要做的是为 db 中的每个名称从列表中选择另一个随机名称。唯一的条件是应该为每个名称分配不同的名称,并且所有名称只能使用一次。
我试图做的是使用一个列表来包含数据库中的名称并从列表中选择一个随机索引并将其与数据库中的相应位置进行比较。如果它不同,则在该索引处删除,依此类推,直到没有更多名称可以放置。
但在那之后,我意识到这不是一个完美的方法。比方说,我有 5 个名字,
name 1 随机获取 name 3 name 2 随机获取 name 1 name 3 随机获取 name 4 name 4 随机获取 name 2 并且... name 5 只能获取 name 5,所以在这种情况下它不起作用。
任何人都知道我怎样才能使它工作?我应该使用什么其他方法?名字的数量大约是 20。稍后我将不得不为每个名字分配 2 个不同的名字。但首先我需要解决这个问题。
任何帮助将不胜感激!我正在用 C# 编写
python - 如何在python中进行类别的加权随机样本
给定一个元组列表,其中每个元组由一个概率和一个项目组成,我想根据其概率对一个项目进行采样。例如,给出列表 [ (.3, 'a'), (.4, 'b'), (.3, 'c')] 我想在 40% 的时间对 'b' 进行采样。
在 python 中这样做的规范方法是什么?
我查看了 random 模块,它似乎没有适当的功能,并且在 numpy.random 中,虽然它具有多项式函数,但似乎并没有针对这个问题以一种很好的形式返回结果。我基本上是在 matlab 中寻找类似 mnrnd 的东西。
非常感谢。
感谢所有的答案这么快。澄清一下,我不是在寻找如何编写采样方案的解释,而是指出一种简单的方法来从给定一组对象和权重的多项分布中采样,或者被告知不存在这样的函数在标准库中,因此应该自己编写。
r - Random sampling
I would like to know how to implement a way to get a random sub-sample within a larger sample in R using a large collection of true random numbers (obtained using a quantum generator) those are integers which can have multiple occurrences.
__
Edit: Solution.
Since I needed a remise and my generated numbers in a float64 were finally unique (due to the high precision), I have used the following solution :
1) generate as many numbers as length(data)
2)
3) split the dataset
javascript - JavaScript从一个范围内随机选择/返回一个数字?
赫伦和门施!
Ich habbe eine 对您的问题是:使用 infomous Math.round() 随机返回 a/from 范围(从 -> 到)之间的数字?
在大多数 Web 浏览器支持的有争议的 JavaScript 脚本语言中,这是如何实现的?
performance - 从庞大的列表中进行有效的随机抽样
我有一个包含大量值(53,000,000+)的数据文件,我想提取其中n个值的随机子集(例如,2,000,000)。我实现了一个 Perl 脚本,它将列表拉入内存,使用Fisher-Yates 方法对数组进行混洗,然后打印出混洗列表中的前n 个值。但是,即使在更小的测试集(50,000 个值)上,这种洗牌过程也需要很多时间。
我正在寻找一种更有效、更可扩展的方法来识别大量值的随机子集并将其打印出来。有什么建议么?
更新:根据答案和更多搜索,看起来正确的术语是“随机抽样”。
python - Numpy 的随机模块使 Python 的随机模块无法访问
当我调用random.sample(arr,length)
错误时返回random_sample() takes at most 1 positional argument (2 given)
。经过一番谷歌搜索后,我发现当我想调用随机模块的样本函数时,我正在调用 Numpy 的随机样本函数。我尝试以不同的名称导入 numpy,但这并不能解决问题。不过,我需要 Numpy 来完成程序的其余部分。
有什么想法吗?谢谢
r - 从带有样本的多项分布中抽取大量样本 (1e09)
我想从多项分布中抽样。我会通过使用样本并指定一些概率来做到这一点。例如:我有 3 个类别,我想采样 10 次。
我的设置现在只在以下方面有所不同:我想采样很多(例如 1e09)数字。实际上我只对每个类别的频率感兴趣。所以在上面提到的例子中,这意味着:
有人知道如何尽可能高效地计算它吗?
谢谢,斯蒂菲