ruby - 如何使用 Anemone 仅抓取子文件夹

Question

我们可以用海葵（例如：）抓取一个漏洞网站https://stackoverflow.com/，但是如果我只想关注某个文件夹（例如：httpsquestions ://stackoverflow.com/ ）怎么办。我怎样才能做到这一点？也许使用“focus_crawl”方法？

score 2 · Accepted Answer

检查keep_if方法可能有帮助

尝试按照您要爬行的方式传递模式

注意：我还没有测试过，但你肯定可以尝试。

1 回答 1