问题标签 [data-generation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 用于分类数据的人工数据集生成器
我正在评估一种算法,并想使用人工数据。
该算法适用于一维人工数据集,如StackOverflow answer所示。
我想测试具有多个维度和某些特征(例如噪声、相关性)的数据集的算法。有人已经在 R 中实现了“人工数据集生成器”吗?
任何反馈将不胜感激。谢谢!
visual-studio-2010 - 由于重复的 PRIMARY KEY 约束,数据生成计划失败
在 VS2010 数据库项目中,我尝试为具有现有数据的表生成测试数据(在出现提示时单击“否”)。标识列(即主键)是 SQL 计算值,因此我无法更改该列的数据生成器。
那么为什么数据生成计划不识别数据库中现有的主键值,但总是尝试插入重复项,即,似乎计划总是从种子值开始,而不是从下一个可用的标识列值开始?我可以强制数据生成计划从这个特定表的其他种子值开始吗?
oracle - oracle 11g中从真实源数据库生成测试数据的方法
我在 Oracle 11g 中有生产数据库 - 整个模式。我如何使用它来生成测试数据(所有值都是乱码)并保持关系,(例如,只有字符串值乱码而不是 id 或数字)是否有像数据生成器这样的工具来执行此操作,或者我们可以轻松地手动执行此操作?提前致谢
credit-card - 如何创建随机蜜罐信用卡数据
所以我想创建一些蜜罐信用卡数据。
创建信用卡号码很容易(也许)。我可以在一定范围内创建数字整数值。如果我有野心,我可能会尝试创建 Luhn 有效数字,尽管我可能不想走那么远。事实上,我更喜欢创建已知的无效数字,这将是一种有用的技术。无论如何,至少我会创建一些随机整数。
Sec 码可以是随机的。有效期可以在一定范围内,随机。
困难的部分是:如何创建随机名称?出于明显的隐私原因,我不能真正使用现有的名字,即使我随机重新组合名字和姓氏(John Smith,Jane Doe,Bob Jenkins => John Jenkins,Bob Doe,Jane Jenkins),除非他们特别通用的,如果我在随机数据中创建一些 John Smith 名字,我可能不会介意。
但是我可以用什么来播种无害的数据呢?
visual-studio-2010 - Visual Studio 2010 Ultimate - 数据生成计划为列设置不正确的数据类型
我一直在研究如何在我们的数据库中生成测试数据,以便我们可以测试 CRUD 操作,而不会在插入时遇到外键约束问题。
我决定采用的方法是通过 Visual Studio 2010 Ultimate 的数据生成器功能。为我们的特定数据库设置数据生成器计划并不太难,但我遇到了数据类型问题。
具体来说,将数据库中的一列设置为 Bit 类型;但是,数据生成器计划将数据类型设置为 int。从这里,我可以选择的唯一生成器选项是数据绑定生成器、整数、顺序数据绑定生成器、SmallInt 和 TinyInt。
运行生成器时,除了名称中带有 Int 的选项之外的所有选项都不会产生输出值。使用 Int 生成器之一运行生成器以尝试生成值会导致此错误:
错误 1 TSD50003:生成器 Int 对列 [dbo].[Contract_Relationship].[status] 无效 - 类型位
这个错误很明显,因为该列实际上是一个位而不是一个 Int。不太明显的是我如何才能将列上的数据类型更改为正确的类型。
我尝试查看工具 > 选项 > 数据库 > 默认生成器下的数据类型生成器定义,并且位属于默认数据生成器类别,该类别与 SQL 数据类型类别下的布尔类型相关联。
从这里我也无法更改生成器,因为默认数据生成器类别的下拉列表与每个 SQL 数据类型相关联。尝试更改数据生成器计划中位列的数据类型也不起作用,因为它是只读的。
最后,我会将列设置为 null 作为解决方法,但它设置为不为 null。有人对如何将列的数据类型更改为位有任何建议吗?
先感谢您!
更新:我注意到在开发团队的模式文件中进行了更多研究后,该列实际上在 Create Table .sql 文件中设置为 Int 数据类型。在我看来,数据生成器用于模式的信息来自这些文件。
在 SQL Server 客户端中创建表文件和实际数据库之间的列不正确似乎很奇怪,但这可能与我的问题没有直接关系。
如果有人知道如何更改数据生成器中的数据类型,甚至知道数据生成器从哪里提取模式信息,我仍然会感兴趣。
再次感谢大家的时间。
java - Spring testing:创建和维护测试数据的常用方法是什么?
我正在为我的应用程序的集成测试创建数据,其中包含从 Web 服务层到持久性的数据。我有两个主要的选择来实现这一点,但我担心为测试生成的数据的维护。我的意思是,如果我以编程方式生成数据,我认为将此代码更新到最新版本将比更新生成数据的脚本更容易。
生成测试数据的最常用方法是什么?
sql - 如何为“按其他行的数据分组”算法生成测试数据
更新:我正在寻找一种技术来计算我的算法(或任意算法)的所有边缘情况的数据。到目前为止
,
我尝试的只是考虑可能是边缘情况+产生一些“随机”数据,但我不知道如何才能更确定我没有错过真正用户能够搞砸的东西..
我想检查一下我的算法中没有遗漏一些重要的东西,而且我不知道如何生成测试数据来涵盖所有可能的情况:
任务是报告每个数据的快照,Event_Date
但为可能属于下一个Event_Date
的编辑创建单独的行- 请参阅第 2 组)输入和输出数据插图:
我的算法:
- 列出s 并为它们
event_date
计算snext_event_date
- 将结果加入
main_audit_table
并计算transaction_id
每个快照的最大值(我的插图中的第 1-4 组) -根据是否为真id
,由 和 2 个选项分组event_date
transaction_date < next_event_date
- 加入
main_audit_table
结果以从同一结果中获取其他数据transaction_id
- 加入
costs_audit_table
结果 - 使用transaction_id
小于transaction_id
结果的最大值
我的问题:
- 我如何生成涵盖所有可能场景的测试数据,所以我知道我的算法是正确的?
- 你能看出我的算法逻辑有什么错误吗?
- 这类问题有更好的论坛吗?
我的代码(需要测试):
regex - Perl - 将所有匹配字符串生成到正则表达式
我是 perl 的新手,我想知道是否有一种方法可以生成与正则表达式匹配的所有组合。
如何生成所有匹配字符串的最佳方法是:
提前致谢。
generator - 浮点数据生成器
是否有数据生成的程序或源代码?
我想要一个 Java 数据生成器。(语言无所谓,如果我能得到结果文件)
我想要一个相关数据,反相关数据,独立数据。
我想要一个具有
输入:最小值、最大值、数据分布(例如,独立、反相关、相关、高斯、泊松 ...)、维度、点数 (n)
输出:遵循给定数据分布的 n 个点。
谢谢 :)
python - 在 python 中测试数据生成框架?
有没有专门针对 Python 的“测试数据”生成框架?
为了清楚起见,我不想从头开始编写脚本,用随机用户和其他实体填充我的数据库,我想知道是否有任何工具/框架可以使它更容易,
更清楚地说,我不是在寻找测试框架,我想生成测试数据来“加载”我的应用程序。