所以我正在关注 Storm-Crawler-ElasticSearch 教程并玩弄它。
当使用 Kibana 进行搜索时,我注意到索引名称“状态”的命中数远大于“索引”。
例子:
在左上角,您可以看到“状态”索引有846 次点击 ,我认为这意味着它已经爬过了 846 个页面。
现在使用'index' index,显示只有 31 个 hits。
我知道功能索引和状态是不同的,因为状态只负责链接元数据。问题是 StormCrawler 似乎正在解析许多页面而不是索引它们。
所以我想要的是与显示的内容一样的“索引”点击量。而不是只有 31 个。