问题标签 [data-generation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1957 浏览

c++ - 生成某些形式的两个值 (x,y) 的某些向量的函数

编辑:我简单地重新表述了这个问题:如何在 C++ 或 Python 中生成随机点 (x,y) 以下:圆形分布、方形分布和三角形分布。

这是正方形的简单代码,例如:

0 投票
2 回答
1128 浏览

r - 围绕直线生成点

我正在做一些聚类研究,需要生成类似于以下示例的合成数据:

数据集示例

我们有 2 个类别(红色和黑色)的 2d 图。我怎么能生成这样的二维数据?它有一个 V 结构,所以我正在考虑围绕直线生成点 - 有没有办法在R中做到这一点?我正在使用R,但对其他工具持开放态度(只是数据必须是可导出的)。

0 投票
3 回答
2254 浏览

rest - 在soapui 或soapui pro 中的DataGen?

我想在 SoapUI 中测试 Restful Web 服务。为此,我需要从 Excel 中读取值并将其传递给请求。

我在网上搜索,我发现可以通过DataGen TestStep。我有 SoapUI,但我找不到那个选项。

有人可以告诉 SoapUI-4.5.1 或 SoapUI Pro 中是否提供 DataGen TestStep。

0 投票
0 回答
945 浏览

r - 为聚类生成数据

我想用一些人工数据测试我的随机森林聚类。我想生成具有强可靠性和一些噪音的数据集。

我有 2 个属性,A1 和 A2(均为二进制)。类计算为:A1 xor A2。我添加了一些嘈杂的二进制属性。

例如,我们有:

在聚类中,我们没有类,因此对于随机森林聚类,我们获取原始数据并对其进行转换。我们将所有现有案例标记为第 1 类,并添加标记为第 2 类的合成数据。合成数据是通过从某个属性的所有值中随机抽样构建的。

这是我们得到的:

上半部分是标有类别 1 的原始数据(如上)。线下是标有类别 2 的随机采样合成数据。随机森林试图找到一些区分类别 1 和类别 2 的结构(真实数据与随机数据)。问题是,没有类的 XOR 什么都没有告诉我们,这里也没有什么可学的。

最后,我的问题:如何生成具有非依赖、轻度依赖或强依赖属性的随机森林聚类数据?

0 投票
2 回答
930 浏览

c# - 如何在 Visual Studio 2010 / SSMS 2008 中使用生成的数据填充数据库?

在我的 (c#) Visual Studio 2010 项目中,我引用了一个数据库。

但是,数据库是空的。我想在这个数据库中插入一些虚假数据,以便我可以测试我的应用程序。

有没有这样做的工具/方法?

谢谢!

0 投票
1 回答
1225 浏览

exception - databene benerator 抛出表空异常

我一直在学习使用databene benerator(最新的0.8.1),但我在尝试填充H2数据库时遇到了问题(以前是1.3.170,现在是1.3.171)。首先,我得到了目录空异常,但是在进一步阅读 benerator 文档(0.7.6)时,我发现了这个

When importing database metadata, you might encounter exceptions when Benerator tries to get metadata of catalogs or schemas it has no access privileges to. Usually can fix this by choosing the right schema for your database, e.g. <database id="db" ... schema="PUBLIC" />

Table X not found in the expected catalog Y and schema Z This message tells you, that you database configuration is wrong. Check and fix the 'schema' and 'catalog' settings in your database configuration, e.g. <database … catalog="main" schema="Z" />

所以我在数据库标签中明确写了目录和模式名称

但是当 benerator 刚刚开始填充第一个表时,我开始收到 Table null 异常,这是堆栈跟踪

可能是什么问题,或者我忘了做什么?因为当我使用“复制和扩展现有数据库”创建项目时,benerator 正确捕获了所有表,甚至是主键和外键以及唯一约束。帮助将不胜感激,因为我还没有找到任何其他足够灵活、开源、可扩展并支持 JDBC 和 java 数据库的数据生成器

0 投票
1 回答
147 浏览

regex - databene benerator 正则表达式模式:尝试获取特定模式

如何使用 databene benerator 生成以下模式?A01,A02,A03...A25,然后 B、C、D 等也一样。这样我什至可以得到其他范围,如 A01 到 A15 等。我试过这个

但它继续包括 A00 和 A26 到 A29。

具体来说,我如何给出数字范围,例如从 1 到 10、1 到 20 等?

0 投票
1 回答
832 浏览

date - Databene benerator:使用已经生成的日期,作为同一实体中另一个日期的最小值

我有一个带有开始日期和结束日期的 RESERVATION 实体。我正在使用 benerator 生成测试数据。我想要的是使用 thestart date + 1 day作为结束日期的最小值。事实证明,如何实现这一目标是困难的。这是生成标签的一部分,它使 benerator 抱怨。

那么如何使用生成的开始日期作为要生成的结束日期的最小值呢?

0 投票
1 回答
234 浏览

database - 数据生成:生成一个具有多个日期约束的实体

一个快速的,我正在寻找一种用于数据生成的工具。我有一个带日期的实体;它的日期madestart日期和end日期。我希望数据生成能够处理这些约束:

  1. made也许今天或后天
  2. start可能等于made但不是之前
  3. end可能只是之后的一天start或之后的任何其他日期start

我查看了http://generatedata.comhttp://mockaroo.com,但他们没有办法保持约束。我只需要那个约束,但不确定要尝试维护这些约束的软件。我只需要快速数据来测试我的应用程序。谢谢

渐渐地,你有没有遇到过你需要的东西找不到的情况?

0 投票
1 回答
203 浏览

python - 可以在 python 中显示列表/字典生成器的进度吗?

我使用字典生成器表达式(我为此使用 IDLE)在 python 中构建了非常大的字典(2^20 个元素)。这个过程很长,因为每个元素都需要硬计算。是否有可能获得此操作的已知进度?

我知道如果不使用生成器表达式很容易做到,但是我认为这个问题很有趣。