问题标签 [data-generation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
9 回答
57491 浏览

sql-server - SQL 服务器的数据生成器?

我想收到有关 SQL Server 可用数据生成器的建议。如果发布回复,请提供您认为重要的任何功能。

我从未使用过这样的应用程序,所以我希望接受有关该主题的教育。谢谢你。

(我的目标是在每个表中填充 10,000 多条记录的数据库,以测试应用程序。)

0 投票
1 回答
205 浏览

visual-studio - 数据生成计划错误

当我尝试运行数据生成计划时,我收到以下错误,但没有要删除的列。

列 XXXXX 已被删除,并且之前已选择用于数据生成。

对此错误的任何帮助将不胜感激。

谢谢

0 投票
16 回答
90011 浏览

testing - 生成模拟数据的工具?

我正在寻找一个好的、免费的工具来生成样本数据,以便加载到测试数据库中。以此类推,为任何 RDBMS 生成“ lorem ipsum ”文本的东西。我正在寻找的功能包括:

  • 为现有表定义生成数据的灵活性。
  • 能够生成大小数据集(> 100 万行或更多)。
  • 以 SQL 脚本格式(INSERT语句)或其他适合批量导入的平面文件格式生成(通常更快)。
  • 用于轻松编写脚本的命令行界面。
  • 可扩展的、开源的、用动态语言编写的(这些都是不错的,不是强要求)。

PS:我确实在 StackOverflow 上搜索了一个重复的问题,但没有找到。如果有的话,我会很感激得到一个指向它的指针。


感谢大家的精彩回复!我应该修改我的要求,即我使用 Mac OS X 作为我的主要开发环境,而不是 Windows(尽管我确实说过命令行界面是可取的,并且实际上排除了 Windows)。不过,Windows 特定的建议无疑会对这个问题的其他读者有用,所以谢谢。


这是我的结论:

  • 生成数据:
    • PHP Web 应用程序界面,而不是命令行
    • 仅限于生成 200 条记录(或为生成 5,000 条记录的许可支付 20 美元)
  • RedGate SQL 数据生成器
    • 不是免费的,售价 295 美元
    • 需要 Windows、.NET、SQL Server
  • Visual Studio 2008 数据库版
    • 需要 Windows
    • 需要昂贵的 MSDN 或 ISV 订阅
  • 横幅数据检测
    • 不是免费的,价格 595 美元
    • 需要 Windows (?)
    • 不支持 MySQL (?)
    • GUI,不是命令行或可编写脚本的
  • Ruby Faker 宝石
    • 使用 ActiveRecord 进行批量数据加载太慢了
  • 超级棒
    • 主要是负载测试工具,内置随机数据生成器
    • 不过使用起来很简单
    • 总体来说是一个不错的亚军工具
  • Databene Benerator
    • 满足我需求的最佳解决方案
    • XML 脚本,与 DbUnit 兼容
    • 开源 (GPL) Java 代码
    • 命令行使用
    • 通过 JDBC 直接访问许多数据库
0 投票
4 回答
1503 浏览

python - 生成 one-hot 编码的字符串表示

在 Python 中,我需要生成一个dict将一个字母映射到该字母的预定义“ one-hot ”表示。举例来说,dict应该如下所示:

字母表中的每个字母都有一位(表示为一个字符)。因此,每个字符串将包含 25 个零和一个 1。 的位置1由字母表中相应字母的位置决定。

我想出了一些生成此代码的代码:

是否有更高效/更清洁/更 Pythonic 的方式来做同样的事情?

0 投票
5 回答
8874 浏览

java - 如何从正则表达式生成与正则表达式匹配的文本?

是的,你没看错。我需要能够从正则表达式生成随机文本的东西。所以文本应该是随机的,但要通过正则表达式匹配。它似乎不存在,但我可能是错的。

只是一个例子:该库将能够以 ' [ab]*c' 作为输入,并生成示例,例如:

abc
abbc
bac

等等

更新:我自己创造了一些东西:Xeger。查看http://code.google.com/p/xeger/

0 投票
4 回答
1511 浏览

dynamic - 如何读取/解析动态生成的网页内容?

我需要找到一种方法来编写一个程序(以任何语言),该程序将连接到一个网站并从该网站读取动态生成的数据。

请注意,它是动态生成的——仅获取源 html 是不够的,因为我感兴趣的数据是通过引用后端代码的 javascript 生成的。所以当我查看网页源时,我看不到数据。(例如,去谷歌搜索。在搜索结果页面上查看源代码。您的浏览器显示的数据很少反映在源代码中——大部分是动态生成的。我需要一些方法访问此数据。)

0 投票
2 回答
1384 浏览

sql-server-2008 - 创建包含正确查找表值的数据生成计划

我刚刚开始使用 Visual Studio 数据库项目并且喜欢我可以用它创建的数据生成计划。但是,在我的一个项目中,我需要使用特定值填充查找表。由于查找表和另一个表之间存在外键关系,我无法在不从计划中删除另一个表的情况下从数据生成计划中删除查找表。但是我无法为另一个表生成任何数据。

我该如何 a) 指定我希望生成器在将数据添加到查找表时使用的确切数据,或者 b) 让生成器不向表中添加新值,而是使用已经存在的值?

谢谢!

0 投票
1 回答
102 浏览

visual-studio-2008 - 数据生成计划连接字段

数据生成计划是否可以有 2 个具有相同数据的字段?例如,表 aspnet_roles 有 2 个字段 RoleName 和 LoweredRoleName,我希望它们显示相同的数据。

0 投票
2 回答
915 浏览

testing - 如何生成准随机统计数据集?

我正在寻找一种工具,可以让我生成具有某些统计属性的数据集。例如,假设我想生成 100 万个具有 x 个异常值的整数,用于测试。

是否有任何工具可以生成这样的测试数据集?我不一定需要任何花哨的东西,只需要一些基本功能。

0 投票
0 回答
130 浏览

concatenation - 连接两列以形成电子邮件的数据生成计划

使用 Visual Studio 数据生成计划,我有两列,FirstName 和 Lastname,从数据绑定生成器(引用以实际有效的名字和姓氏为种子的数据库)填充。我想为电子邮件生成另一列,格式为@test.com。

例如:

弗雷德,史密斯 => fsmith@test.com

现在我正在为电子邮件使用正则表达式,所以它只是随机的并且与名称无关。在另一列中生成数据时找到一种引用其他列的方法会很棒,因为我将在我的数据库中的任何地方都这样做。