可以告诉我使用什么编程语言来搜索十亿个文本文档。txt 文件大小为 3 KB。C++/Java 怎么样?搜索将仅通过 txt 文件的名称进行。
谢谢大家的回答,我决定用C++
一种特定的语言可能不是在这里使用的正确标准。
有许多搜索工具可以很好地搜索大型数据集,许多不同的编程语言都可以使用这些工具。
Sphinx就是一个例子,它是一个搜索服务器。您可以在多种语言中使用它的索引,例如带有ThinkingSphinx的 Ruby 。来自 Apache 的Lucene是另一种搜索技术,它适用于用 Java 编写的应用程序(但也有.NET和Ruby端口)。
假设您的意思是从十亿个文档中搜索一个文档,您几乎可以使用所有可用的编程语言。简单的选择可能是 python 和 java。一种更方便的方法可能只是使用 shell 进行搜索,然后运行 .bashrc 之类的 bash 命令sudo find / -name "filename"
。