我在 Eclipse 中使用 Python 2.7。我正在做一个使用 Scrapy 构建基本网络爬虫的教程。链接在这里。
http://www.youtube.com/watch?v=4fbvkMhvsWY
在命令提示符下启动刮板之前,我在尝试以下代码行时收到“未解决的导入”错误:
from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector
当我尝试使用以下命令在命令提示符下爬网时:
scrapy 抓取我的文件
我收到错误消息 "Spider not found: myfile"。
我的 items.py 文件中还有另一个未解决的导入错误。“字段”不仅得到“未解决的导入”错误,而且还得到“未使用的导入”错误。
items.py 文件中的代码:
from scrapy.item import Item, Field
这是蜘蛛文件中的代码:
蜘蛛文件(命名为 Tutorial1.py)
from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector
class Tutorial1 (BaseSpider):
name="Tutorial1"
allowed_domains=['http://wikipedia.org']
start_urls = ["http://en.wikipedia.org/wiki/Home_page",]
def parse(self, response):
hxs = HtmlXPathSelector(response)
print hxs.select('//div/a').extract()
此外,在尝试做其他教程时,我遇到了同样的问题,让我相信这与我的目录有关。不过我不确定。
我发现其他人也有类似的问题。
我的系统路径如下所示:
C:\Python27;C:\Python27\Scripts
导入以下内容时我没有收到错误:
import zope.interface
import twisted
import lxml
import OpenSSL
import scrapy
请帮我解决这个问题。提前致谢。