1

我打算用 C++ 编写一个网络爬虫,它每天爬 N 个页面。主要问题是我对存储系统感到困惑。所以我需要一个分布式数据库来有效地存储我的爬网数据。谁能建议我满足条件的数据库?

4

2 回答 2

0

MongoDB 可能是一个很好的选择,因为它以一种直接且高效的方式支持几乎所有的需求(包括一个很好的查询 API)。分发是通过“分片”完成的。

不要要求比较数据库(经常讨论包括 stackoverflow )。

于 2011-03-20T15:56:43.377 回答
-1

除非 N 非常大,或者您计划存储大量版本,否则您可能不需要分布式数据库。尝试从 MySQL 开始

于 2011-03-21T15:37:23.723 回答