我有一个基于 Spring 的 Java webapp。我的问题是:
我有一个 34MB 和 270 万行的文件。行只是一个接一个的单词:
abc
abcdfg
xyz
etc
我需要从这个文件中选择 15 个随机的唯一行,这些行并不以非常快的方式彼此相邻。我知道要搜索这么大的文件,我可以使用 Apache Lucene。你知道 Lucene 能不能帮我弄到这些随机线。或者,也许您有其他想法可以帮助我解决这个问题。
我真的很感激任何帮助
提前致谢
编辑:
或者也许只是把这个文件放入数据库[PostgreSQL]?