问题标签 [sample-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
7 回答
17510 浏览

search - 如何找到成千上万的公司名称?

如何查找或生成数千个公司名称以用于测试和演示目的?(地址、电话号码和相关信息也很好。)

我正在构建一个包含业务联系信息的系统。毫无疑问,相当普遍。

我的测试/演示数据库目前已随机生成加载个人姓名(感谢我找到的方便的 IRS 电子表格)。这对于内部测试和审查目的非常有效,但在向潜在客户展示时看起来真的很奇怪。

我尝试了各种在线公共信息源(例如 EDGAR 和基于县的财产记录搜索),但这些都需要我一次手动将结果拼接到 50 个左右的名称块中。我可以做到这一点,但我真的希望有一个搜索服务或数据存储,这些信息可以很容易地在非常大的批次中搜索和检索。

0 投票
4 回答
584 浏览

database - 测试数据生成器/生成可靠、非重复但不真实的数据库样本数据的最快途径?

我需要为客户建立一个远程数据库的快速可行性测试/概念验证,其中将填充大多数典型的公司和人员数据(姓名、地址等);150K 左右的记录。这里提到的示例数据库很有帮助:

我在哪里可以找到可以在多个数据库引擎中使用的具有通用格式数据的示例数据库?

...但是,我也希望能够在不太典型的数据集上轻松生成这样的样本数据。有人对现成(或离线)解决方案有任何建议吗?

0 投票
5 回答
441 浏览

string - 需要格式良好的数据进行测试

有时您需要用于测试的数据,例如Adob​​e Thermo已经预先编写了数据“集”,例如 1 字字符串、3 字字符串等,用于填充数据控件。

我需要:

  • 连续文本,没有换行符
  • CSV 数字、整数
  • CSV 数字、小数
  • URL 编码字符串

关于如何获得其中任何一个的任何想法?

0 投票
4 回答
3888 浏览

test-data - 示例数据创建工具(主要用于数据库)

我正在考虑一些数据库设计概念,并相信创建模拟我的应用程序的真实世界体积的示例数据将有助于巩固一些设计决策。

有谁知道创建示例数据的工具?如果可能的话,我正在寻找与数据库和平台无关的东西(从 MySQL 到 DB/2,从 Windows 到 UNIX),以便跨不同系统/架构测试设计。我正在设想一些您可以使用的工具:

  1. 指向数据库表( DSN 的某些配置等)
  2. 内省字段并基于字段...(点击或添加一些配置)
  3. 有一种表达如何创建样本数据的方法MySQL Sample Data Creator是我所设想的那种东西,但我认为他们会有更多的选择,比如提交频率,以便创建非常大的数据集......数百万或数十亿行...不要认为这个工具会扩展到我想要创建的数据量)
  4. 按下按钮即可(取决于您的参数,这可能需要很长时间)

有什么想法吗?当然,我可以编写一个应用程序来做到这一点,但它看起来很普通,我不应该重新发明轮子。

0 投票
7 回答
170822 浏览

sql - 用于练习的示例数据库

我想玩一个更大的数据库来测试我对 SQL 的了解。

是否有一个巨大的 .sql 可以用来处理 SQL 查询?

0 投票
7 回答
2634 浏览

wiki - 我如何获得维基百科页面的子集?

我如何获得维基百科页面的子集(比如 100MB)?我发现您可以将整个数据集作为 XML 获取,但它更像是 1 或 2 个演出;我不需要那么多。

我想尝试实现 map-reduce 算法。

话虽如此,如果我能从任何地方找到价值 100 兆的文本样本数据,那也很好。例如,Stack Overflow 数据库,如果可用的话,可能是一个不错的大小。我愿意接受建议。

编辑:任何不是种子的?我不能让那些工作。

0 投票
2 回答
313 浏览

sql-server - 可用于测试目的的最大的 SQL Server 引擎免费数据库是什么?

可用于测试目的的最大的 SQL Server 引擎免费数据库是什么?

0 投票
5 回答
6468 浏览

database - 北风的替代品

那么,存在哪些替代示例数据库具有:

  • 非限制性许可证
  • 大量样本数据
  • 很多数据类型
  • 将数据库添加到数据库服务器的简单机制
  • 不是北风

我不太在意 db 是为什么服务器类型(MSSQL、SQLite、MySQL 等)设计的。

0 投票
6 回答
14182 浏览

sql-server - 包含数据的示例 Employee SQL Server 数据库

嗨,我需要一些示例 SQL Server 员工数据库,其中包含 id、姓氏、姓名、年龄、地址等数据。它一定很大,我用谷歌搜索,但我没有找到任何好的示例。任何身体都可以帮忙吗?

0 投票
2 回答
1360 浏览

oracle - Oracle 样本数据问题

所以,我有这个基于 java 的数据转换/屏蔽工具,我想在 Oracle 10g 上进行测试。Oracle 10g 的好处是您可以获得大量示例模式,其中有 50 万条记录。架构是:SH,OE,HR,IX等。所以,我安装了10g,发现安装脚本在ORACLE_HOME/demo/scripts下。

我稍微定制了这些脚本以在批处理模式下运行。这解决了我一半的需求——为我的数据转换软件测试创建源数据。要求的后半部分是我在没有任何数据的情况下以不同的名称(TR_HR、TR_OE 等等)创建相同的模式。这些模式将代表我的目标模式。因此,简而言之,我的软件将从模式中的表中提取数据并将其加载到不同模式中的同一个表中。

现在,我在创建目标架构和清空它时遇到了两个问题。

  • 我想在批处理作业中这样做。但是您获得的 oracle 脚本、示例模式名称是不可配置的。因此,我尝试创建一个脚本,将 OE 替换为 TR_OE,将 HR 替换为 TR_HR 等等。但是,这种方法有点烦人,因为示例模式的创建方式有点复杂;Oracle 创建同义词、视图、物化视图、数据类型和许多奇怪的东西。
  • 我希望目标模式(TR_HR、TR_OE、...)为空。但是有些模式有循环引用,这不允许我删除数据。唯一的解决方法似乎是删除某些外键,删除数据,然后重新添加约束。

有没有什么简单的方法来解决这一切,而不必大惊小怪?我需要一个复杂的数据集来进行测试(复杂的如带有触发器的表、多个层次结构......例如......一个具有多达 5 个级别的子表、一个引用 IOT 表和一个 IOT 表的父表指的是非物联网表等。)。从数据集的角度来看,示例模式几乎是完美的。我看到的唯一挑战是自动化加载源模式的整个过程,然后创建目标模式并清空它们。感谢您的帮助和建议。


更新

手动安装 oracle 示例模式需要运行的主要脚本是 mkplug.sql。这是从 dmp 文件加载模式的行:

好吧,我尝试将这一行修改为:

而且......它没有帮助。架构是用行数据创建的,尽管 rows=n 属性:(