所以我的问题是,我如何才能搜索大约 500 mb 的多个文件,当然要尽可能快,但 cpu 使用率也要尽可能低,还有第二个要求:函数必须能够返回行搜索文本已打开,因此不仅知道文本在文件中,还是在文件中多次出现,还返回搜索文本出现的行。
在此先感谢,blackwolf12333
所以我的问题是,我如何才能搜索大约 500 mb 的多个文件,当然要尽可能快,但 cpu 使用率也要尽可能低,还有第二个要求:函数必须能够返回行搜索文本已打开,因此不仅知道文本在文件中,还是在文件中多次出现,还返回搜索文本出现的行。
在此先感谢,blackwolf12333
我建议你在倒排索引中创建并搜索。创作需要更多的时间,但这只是一次性的费用。创建索引后,搜索速度非常快。Apache Lucene是您可以使用的流行开源库。
可能您应该尝试使用Lucene索引器进行快速搜索。如果你不想像 Lucene 这样大的库,你可以手动创建索引来搜索,这并不难。