1

我正在编写一个搜索引擎,我正在寻找一个数据库来存储我所有抓取的数据,这些数据将用于 URLDatabase 和数据存储。

  1. 它应该基于磁盘而不是基于内存

  2. Java 更可取,因为我的应用程序是在 Java 中的,因此我可以轻松地嵌入它。

  3. 可售

  4. Linux 和 Windows 的首选。

4

2 回答 2

0

我真的很喜欢Solr ,它是Lucene上的一个瘦 Java 包装器,它是一个使用非常广泛、性能极好、基于文本的 nosql 数据库(可能是使用广泛的数据库)。

查找匹配项的速度非常快(毫秒响应),您可以在获得结果时对结果进行排序。

它非常易于设置,在 tomcat 下运行,使用普通的旧磁盘文件并在 linux 和 windows 下运行,因此它满足您的所有要求。

我已经在几个项目中使用过它,而且总是很成功。

于 2012-06-04T13:49:26.383 回答
0

看看 Hadoop 和 HBase

http://hadoop.apache.org/

http://hbase.apache.org/

于 2012-06-04T13:26:45.417 回答