问题标签 [seeding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 设置种子时的整数是什么意思?
我想使用Rsample()
中的函数从我的数据集中随机选择 n 行。我每次都得到不同的输出,因此使用函数来获得相同的输出。我知道 中的每个整数都会给我一个唯一的输出,如果设置相同的种子,输出将是相同的。但是我无法弄清楚作为参数传递给函数的整数的含义。它只是进入随机生成器算法的一个索引,还是意味着您开始采样的部分数据?例如,in是什么意思?set.seed()
set.seed()
set.seed()
2
set.seed(2)
scala - Spark 中的 takeSample() 函数
我正在尝试在SparktakeSample()
中使用该函数,参数是 -数据、要采集的样本数和种子。但我不想使用种子。我想每次都有不同的答案。我无法弄清楚我该怎么做。我尝试使用作为种子值,但它给出了一个错误,因为我认为数据类型不匹配。有没有其他类似的功能可以在没有种子的情况下使用?或者我可以使用任何其他实现,以便每次都能得到不同的输出。System.nanoTime
takeSample()
takeSample()
ruby-on-rails - 在 Rails 控制台中查看种子结果
我创建了一个种子文件,运行rake db:migrate
并且rake db:seed
一切似乎都运行良好。但是,我现在想在 rails 控制台中查看种子,表的名称是usersinfo
. 如何查看以验证控制台中的种子是否正确填充?
我usersinfo.all
在控制台中尝试过,但出现以下错误。
未定义的方法“全部”
ruby-on-rails - 我想为种子添加测试以知道种子没有破碎
测试种子的最佳方法是什么,是否有示例/教程?我已经看过并且没有找到对新手真正有用的东西。
另外,这样的测试的正确名称是什么?
python - 在 Python 中避免 Mersenne Twister 的精确重复
众所周知,Python 使用 Mersenne Twister (MT) 算法来处理其随机数。然而,尽管周期很长(~2^19937),但众所周知,当您对大于 2080 个元素的序列进行洗牌时(因为 !2081 > 2^19937),您无法达到每个随机排列。当我处理排列和统计属性对我来说很重要时,我试图找出将 Python 生成器与额外的随机源混合或重新播种以避免重复的最佳方法。
目前,我的概念是使用系统随机数生成器(SystemRandom)为MT生成器添加一个外部随机源。我可以想到两种方法来做到这一点:
- 将 SystemRandom 随机数与 MT 随机数异或
- 使用 SystemRandom 重新播种 MT
第一种方法由硬件随机数生成器以某种频率使用,以减少它们的偏差趋势。但是,它的效率非常低。在 Windows XP 机器上,SystemRandom 比标准 Python 随机函数慢 50 倍。当您的大部分功能都涉及改组时,这对性能造成了巨大的影响。鉴于此,使用 SystemRandom 重新播种 MT 应该会更加有效。
但是,这种方法也存在两个问题。首先,在运行期间重新播种 MT 可能会破坏其统计特性。我相当肯定,如果 MT 运行的时间足够长,这应该不是问题,因为每次运行的 MT 值都应该是格式正确的(无论起点如何)。然而,它确实表明在 MT 重新播种之间有一个相当长的时期是优选的。其次,有一个问题是什么是触发重新播种的最有效方法。处理此问题的最简单方法是使用计数器。然而,更有效的方法可能是可能的。
那么,关于这一点有三个问题:
- 有没有人读过任何关于在每 N 个样本后用随机值重新播种 MT 会改变其理想的统计特性的内容?
- 有没有人知道比增加计数器来触发重新播种更有效的方法?
- 最后,如果有人知道解决这个问题的一般更好的方法,我会全力以赴。
ruby-on-rails - 转储 Heroku 数据库以在本地 seed.rb 中使用的最简单方法?
我可以使用 .dump 转储 Heroku 数据库$ heroku pgbackups:capture
。此外,这篇 SO 帖子显示,有一些工具可以获取开发数据库并将其转储到 seed.rb。
我想知道是否有一种简单的方法可以将这两个过程结合起来,有效地将生产 Heroku 数据库中的数据转储到我本地的seeds.rb 中,以进行更现实的开发测试。
如果这是可能的,那么最干净的方法是什么?
更新:
基于 dB' 的深刻回答,我可能会考虑在本地使用 PGSQL。但是,如果有办法轻松做到这一点,我仍然对问题的 seed.rb 方面感兴趣。
c# - 实体框架 - 在 Seed() 方法中实现一对多外键关系
我有以下课程:
房东
住宅物业
一个 Landlord 可以拥有多个 ResidentialProperties,因此关联是一对多的。我正在尝试使用该Seed()
方法将测试数据添加到我的数据库中。我的问题是我不知道如何在方法中定义关系的多端。以下是我尝试过的:
给出“ResidentialProperties = residentialProperties.FirstOrDefault(x => x.ResidentialPropertyId == 1)
无法将类型 ResidentialProperty 隐式转换为 ICollection < ResidentialProperty > 错误。
如何在 Seed() 方法中实现一对多关系?
编辑:
我在上下文类中添加了以下内容来尝试实现这种类型的关系:房东可以有许多住宅属性。一个 ResidentialProperty 只能有一个 Landlord:
我仍然收到此错误:
\tSystem.Data.Entity.Edm.EdmAssociationEnd: : 多重性在关系“Landlord_ResidentialProperties”中的角色“Landlord_ResidentialProperties_Target”中无效。因为从属角色是指关键属性,所以从属角色的多重性的上限必须是'1'。
仍然对我做错了什么感到茫然。
c++ - 就生成随机数而言,种子是什么?
就生成随机数而言,种子是什么?
我需要生成数百到数千个随机数,我已经阅读了很多关于使用“种子”的信息。什么是种子?是随机数开始的种子吗?例如,如果我将种子设置为 5,它会生成从 5 到我的限制的数字吗?所以它永远不会给我 3 例如。
我正在使用 C++,所以如果你提供任何示例,如果它是在 C++ 中会很好。
谢谢!
r - `sample()` 使用相同的 `set.seed()` 给出不同的值
我正在创建一些随机样本并绘制它们并注意到一个奇怪的行为。加载 ggplot2 后采样值不同:
我可以很容易地避免这种行为,但是 ggplot2 有什么理由改变种子值吗?
asp.net-mvc - 如何使用 HttpPostedFileBase 类型播种我的 MVC 模型?
我已经搜索了这个答案的高低,但找不到任何东西......我是不是很愚蠢?
我想我必须实例化一个 httppostedfilebase 的对象,但我该怎么做呢?