0

哪个更适合在大型网络爬虫中构建 URL 队列。链表还是 B 树?

4

3 回答 3

2

如果您不需要搜索队列(并且队列通常不需要搜索),那么使用链表。

于 2009-06-02T02:46:44.490 回答
1

如果你正在构建一个大型爬虫,你几乎肯定想要使用类似 AMQP 消息队列的东西,很可能是 RabbitMQ。RabbitMQ(和许多其他类似的 MQ)在正常安装的情况下每秒将执行超过 100,000 个事务。我在自己的蜘蛛/爬虫设置中使用它,它就像一个魅力。当然比从头开始构建类似的东西要容易得多。

于 2009-07-15T18:44:25.257 回答
1

如果顺序很重要(并且队列很重要),则使用链表。如果你需要搜索队列,那么B-tree。

于 2009-06-02T03:00:11.777 回答