问题标签 [data-generation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1450 浏览

python - Python:sklearn为数据点生成指定范围内的集群

我试图在 x 的范围内生成一个集群,使得 0 < x < 10 和在 y 的范围内,使得 0 < y < 10 与中心 x = 5 和 y = 5。我找不到任何解决方案在线的。谁能帮我这个。以下是我到目前为止得到的

如您所见,输出值的 x 从 4 到 6 不等,对于 y 也是如此。我需要能够生成可以控制此范围的集群。

0 投票
2 回答
189 浏览

caching - 从哪里获取数据来比较缓存算法

我不想在真实数据上比较 LRU、SLRU、LFU 等缓存算法。

这就是为什么我需要一些方法来生成类似真实的数据来比较缓存算法或从某些应用程序中获取这些数据。

0 投票
1 回答
292 浏览

python - 如何创建地理参考随机数据?

我正在写一篇关于 GWR 中不同参数设置的论文(https://cran.r-project.org/web/packages/spgwr/vignettes/GWR.pdf)。为了执行测试,我需要显示某种空间相关性的地理参考数据的可用性(即值不独立于它们的地理位置,而是根据具有高值区域和低值区域的空间而变化)。数据集应该有地理坐标(即纬度和经度),并且它们的密度模式应该不同。

举个例子:

两个质心

一个质心

制服

边缘比中心密集

对我来说,一个很好的起点是阅读这个问题:Generating multidimensional data and even more this question on http://gis.stackexchange.com https://gis.stackexchange.com/questions/35159/how-can-i-conduct -geographically-weighted-principal-component-analysis-using-arc

但是,我在为这些数据提供空间自相关的过程中很累。关于如何实现这一目标的任何想法?如果代码在 Python 或 R 中,我将不胜感激。

0 投票
1 回答
359 浏览

matlab - 如何在分类决策树中获取特定类类型的决策路径

假设我创建了一个分类决策树,如下所示:

输出如下:

在此处输入图像描述

问题

1)我怎样才能得到所有导致叶子值为'0'的路径?

2)是否有任何基于决策树创建新实例的微妙方法(除了随机生成实例并循环直到所需的输出)?例如,我想创建一个随机实例,上面的树将其分类为“0”

0 投票
1 回答
630 浏览

c# - 从 MongoDB 本身运行 Cron Job 以生成数据

以下是有关我的开发环境的信息:

-MongoDB 3.0.0

-MongoDB C# 驱动程序版本 1.7.0.4714

-Microsoft Visual Studio 专业版 2013

-.NET 框架 4.0

在 MongoDB 数据库中,有一个用户集合,而 DiaryEntries 将是一个集合。

假设我们必须为我们的用户生成一些每日日记条目,如果用户没有登录来自己创建它。

我们可以创建一个 Windows 任务调度程序来运行一个 cron 作业 C# 程序来为我们应用程序的每个用户创建日记条目,而这些用户在当天没有它。

但是,随着时间的推移,应用程序中会有大量的用户,并且似乎每天都在运行一个 cron 作业 C# 程序,首先检查每个用户是否有一个每日日记条目,然后只创建一个每日如果用户当天没有日记条目。

我想知道是否有一种方法可以从 MongoDB 本身运行 Cron Job 以生成数据来完成上述任务。如果是,那么性能可能比从 C# 执行任务更好吗?如果它比从 C# 执行它的性能更好,那么请告诉我如何在 MongoDB 本身内实现它?

0 投票
1 回答
24 浏览

matlab-figure - 样本均匀地位于matlab中的一个圆圈上

我想用这种条件在 Matlab 中模拟数据:

样本均匀地位于半径为 3 的圆上。方差为 0.05 的法线噪声被添加到 X 和 Y 坐标。

这个数据的数字在这里:

在此处输入图像描述

0 投票
1 回答
23 浏览

r - 根据颜色生成具有集合均值和方差的数据集

我有一个这个数据集structure(list(Color = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L), .Label = c("blue", "green", "red" ), class = "factor")), .Names = "Color", row.names = c(NA, -30L ), class = "data.frame")

我想添加一个列,将平均值 5 和方差 2 分配给蓝色,将平均值 10 和方差 4 分配给绿色,将平均值 100 和方差 15 分配给红色..

0 投票
1 回答
95 浏览

r - 如何使用 if 函数在 r 中创建随机损失样本

我目前正在为一个学校项目生成一些随机数据。

我使用二项分布在 R 中创建了一个变量,以确定观察是否有损失 yes=1 或 not=0。之后,我尝试使用随机分布为所有已经有损失(= 1)的观察结果生成损失量。

由于我的损失金额是一个百分比,它可以在 0 之间的任何地方

Beta 分发背后的直觉是什么@ stats.stackexchange

在第三步中,我正在寻找一个 if 语句,它结合了我的两个变量。

请在下面找到我的代码(仅适用于 Loss_Y_N 变量):

理想情况下,我可以将两者结合成类似的东西

任何输入高度赞赏!

0 投票
1 回答
58 浏览

clojure - 生成地图矢量

我需要生成充满随机数据的地图矢量,看起来像这样:

我正在考虑使用clojure/data.generators“clojure.test.check/generators”或“clojure.test.check/generators”,对于 clojure 来说是个新手。你能给我一个代码片段吗?谢谢

0 投票
5 回答
1534 浏览

java - 需要一个用于 Java 控制台应用程序的假数据生成器

我需要一个用于基于控制台的 jdbc 应用程序的假数据生成器(例如,用于一个人的个人信息,如名字、姓氏、电子邮件等)。因为我想将那些随机人的数据添加到 MySQL 数据库中。

我的 MySQL 代码如下: