我需要测试一些图表类。对于这些,我想创建一个包含 1-2 百万数据的大数据集!我怎样才能创建这么大的数据集?
谢谢
这个问题有点太开放了,但总之你可以创建一个程序来生成随机数据。基本上对于每个数据字段,选择一个数据范围(例如:0 - 100、“真”/“假”等)。然后让你的程序用随机数据填充每个字段。将该字段写入您的数据集并重复该过程数百万次......
我的项目http://fluentetl.codeplex.com/可能会帮助你。
您可以轻松地使用它将测试数据转储到数据库中,这实际上在示例中进行了说明。
一个示例通过代码生成数据。另一个示例连接 2 个文本文件、一个名字列表和一个姓氏列表,并将所有可能的组合插入到一个表中。您可以制作自己的随机数据循环以保存到数据库中。
任何基于文本的内容,您都可以将其用作种子,也许只需将其设为字符串,然后将其拆分为字符串数组并开始组合数组的随机索引,而对于数字,只需使用随机功能。这是你的种子:
Lorem ipsum dolor sit amet, consectetur adipiscing elit。Fusce scelerisque nulla congue felis interdum nec lobortis turpis blandit。Ut sagittis molestie lacinia。Phasellus iaculis justo vel ligula 前庭 pretium。菜豆非 iaculis nibh。Curabitur eu ipsum dignissim eros volutpat dignissim。Maecenas lobortis ultricies nisl,坐在 amet laoreet leo tristique eget。Donec ullamcorper,metus condimentum vehicula mollis,urna lorem tincidunt arcu,eget rutrum nisl enim sat amet enim。Aliquam ac mitellus。Nullam vitae justo lacus,在 posuere arcu 中。Aliquam infantum lacus eu urna congue pellentesque。Nammalesuada tincidunt odio,eget adipiscing libero pulvinar sat amet。Ut risus dolor, condimentum non cursus ut, convallis vitae elit。Aliquam ultricies consequat nulla eget convallis。Maecenas eget sollicitudin neque。Etiam aliquam commodo sagittis。
利用现有数据集,例如 Stackoverflow 用户数据。
for(i = 1; i <= 2000000; i++) {
insertRandomData();
}
Visual Studio Team System 数据库版具有执行此操作的功能
复制任何现有数据并将其粘贴数百万次。