我在 scraperwiki 上有一个非常简单的 python 脚本:
import scraperwiki
import lxml.html
html = scraperwiki.scrape("http://www.westphillytools.org/toolsListing.php")
print html
我还没有写任何东西来解析它......现在我只想要html。
当我在编辑模式下运行它时,它工作得很好。
当计划的抓取运行(或我手动运行它)时,它会省略数十行(甚至数百行)。
这是一个非常小的网页,因此数据过载应该不是问题。有任何想法吗?