0

我有一个 50,000,000 行的数据文件,需要使用 Java 引导每一行。现在我正在使用 Math.random() 生成随机数,然后以蛮力的方式进行引导。然而,这将带我永远。所以我想知道是否有任何 Java 库可以帮助有效地做到这一点,或者我应该在 Java 中调用其他语言吗?无论如何,我的目标是优化整个过程。谢谢!

4

1 回答 1

0

如果整个数据集适合内存(假设文件的各个行不太长,这在具有 8 GB RAM 的典型高端笔记本电脑上可能是可行的)那么您可能可以使用Resamplejava 类维卡。该Resample课程有监督无监督版本。你可以在这里下载 Weka 。

于 2014-04-27T07:09:34.660 回答