4

我正在尝试制作网络解析器并保存它。我找到了报纸图书馆。我正在使用 Eclipse。但是我没有得到好的结果。请帮我。

import newspaper

cnn_paper = newspaper.build('http://cnn.com')

for article in cnn_paper.articles:
    print(article.url)

这是一条错误消息:

Traceback (most recent call last):
  File "D:\workspace2\JesElaSearchSys\NespaperScraper_01.py", line 2, in <module>
    import newspaper
  File "C:\Python27\lib\site-packages\newspaper3k-0.1.5-py2.7.egg\newspaper\__init__.py", line 10, i
n <module>
    from .article import Article, ArticleException
  File "C:\Python27\lib\site-packages\newspaper3k-0.1.5-py2.7.egg\newspaper\article.py", line 12, in
 <module>
    from . import images
  File "C:\Python27\lib\site-packages\newspaper3k-0.1.5-py2.7.egg\newspaper\images.py", line 15, in 
<module>
    import urllib.request
ImportError: No module named request
4

2 回答 2

3

您的代码没有任何问题。您将需要安装或找到newspaperrequest库。您的开发机器上似乎缺少newspaper/库。request

$ pip install newspaper
$ pip install urllib3

上面的命令将帮助您安装它。

于 2015-06-04T13:59:34.780 回答
1

虽然已经有了答案,但 Python2 的报纸库已被弃用,应该避免使用。

报纸已被 Python2 弃用,根据他们的官方文档,这是一个错误的版本。您应该切换到 Python3 版本。

在 Python 3 上安装:

pip3 install newspaper3k

报纸是一个 Python3 库!或者,查看我们已弃用且有缺陷的 Python2 分支。运行: pip3 安装报纸3k 而不是 pip3 安装报纸。在 python3 上,您必须安装报纸 3k,而不是报纸。报纸是我们的 python2 库。尽管使用 pip 安装报纸很简单,但如果您尝试在 ubuntu 上安装,您将遇到可修复的问题。

于 2017-10-05T23:53:26.213 回答