所以,我需要存储大约 8 GB 的信息来迭代/用于计算;但是,我不需要修改任何内容。我可以在我的 perl 脚本中执行此操作,还是内存不足(我有 8 GB 的 RAM)。如果没有,我可以将信息存储在文件中吗?我是否需要将所有内容都放入数据库中(注意:我没有数据库经验,现在想避免使用它们,除非我绝对不能以任何其他方式做到这一点)?对于每次计算,我都需要遍历大约 1 GB 的“句子”子集。对于这些“句子”中的每一个,我都需要导出一个数量,然后比较所有这些数量以获得最高的 X%。
提前致谢。
编辑:没有其他人会使用这些数据。只有一个程序需要访问数据。安全不是问题,但速度是问题。我将使用分叉或线程进行并行化。我可以使用 Windows 或 Linux。