Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在编写一个搜索引擎,我正在寻找一个数据库来存储我所有抓取的数据,这些数据将用于 URLDatabase 和数据存储。
它应该基于磁盘而不是基于内存
Java 更可取,因为我的应用程序是在 Java 中的,因此我可以轻松地嵌入它。
可售
Linux 和 Windows 的首选。
我真的很喜欢Solr ,它是Lucene上的一个瘦 Java 包装器,它是一个使用非常广泛、性能极好、基于文本的 nosql 数据库(可能是使用最广泛的数据库)。
查找匹配项的速度非常快(毫秒响应),您可以在获得结果时对结果进行排序。
它非常易于设置,在 tomcat 下运行,使用普通的旧磁盘文件并在 linux 和 windows 下运行,因此它满足您的所有要求。
我已经在几个项目中使用过它,而且总是很成功。
看看 Hadoop 和 HBase
http://hadoop.apache.org/
http://hbase.apache.org/