0

我需要用几个带有“随机”数据的文件生成磁盘结构来测试我们应用程序的性能。我有几个限制:

  • 每次我生成的数据必须总是相同的,甚至是不同的执行。
  • 数据必须很大(> 8GB)
  • 用于生成数据的资源必须是轻量级的(例如 8 Gb 的 zip 对我无效)
  • 我希望数据看起来像源代码,或者至少是人类可读的。原因是我们的软件管理源代码,它压缩数据,所以我需要生成尽可能接近现实的数据。

例如,我想到的第一件事就是从 github 压缩源代码存储库,但这不是一个选项,因为我们需要在 Amazon 云中进行测试。我们也不想每次都下载 8Gb 的数据,或者上传 zip 文件。

所以我创建了一个带有磁盘结构树的元数据文件和一个在文件中填充数据的程序。元数据文件如下所示:

\dir1 -1
\dir1\file1.data 1435
\dir2\ -1
\dir2\file2.data 44513

路径旁边的数字对于目录是 -1,对于文件来说是所需的文件大小(以字节为单位)。

因此,我可以轻松生成包含随机数据的磁盘结构。这对我无效,因为每次文件内容都不同。

你知道任何库、例子、方法、技术……来执行这个任务吗?

4

0 回答 0