我想知道如何启动基于 Scrapy 的爬虫。我通过 apt-get install 安装了该工具,并尝试运行一个示例:
/usr/share/doc/scrapy/examples/googledir/googledir$ scrapy 列表 目录.google.com /usr/share/doc/scrapy/examples/googledir/googledir$ scrapy 抓取
我从 spiders/google_directory.py 中破解了代码,但它似乎没有被执行,因为我没有看到我插入的任何打印。我阅读了他们的文档,但没有发现与此相关的内容;你有什么想法?
另外,如果您认为我应该使用其他工具来抓取网站,请告诉我。我没有使用 Python 工具的经验,Python 是必须的。
谢谢!