我正在使用带有 mysql 的风暴爬虫。
我有 100 个种子 URL,但我的缓冲区大小仅为 50。
如果一些种子的外链落在桶号为零会发生什么。在那种情况下,这些外链是否也会被视为种子?
Storm Crawler 如何区分种子 url 和其他 url?
我正在使用带有 mysql 的风暴爬虫。
我有 100 个种子 URL,但我的缓冲区大小仅为 50。
如果一些种子的外链落在桶号为零会发生什么。在那种情况下,这些外链是否也会被视为种子?
Storm Crawler 如何区分种子 url 和其他 url?