2

Boilerpipe 是一个很棒的用于清理网页的 Java 程序,我过去曾使用过它。我今天注意到许多用户无法安装 Python 包装器版本并得到 404 和其他错误。这是我从 conda 复制的尝试之一。

/Users/duncan>sudo -H pip install https://pypi.python.org/packages/source/b/boilerpipe-py3/boilerpipe-py3-1.2.0.0.tar.gz 收集https://pypi.python。 org/packages/source/b/boilerpipe-py3/boilerpipe-py3-1.2.0.0.tar.gz 下载boilerpipe-py3-1.2.0.0.tar.gz (1.3MB) 100% |███████████████████████████████ █| 1.3MB 436kB/s 命令 python setup.py egg_info 的完整输出:回溯(最近一次调用最后):文件“”,第 1 行,文件“/tmp/pip-r6swd0hy-build/setup.py”,第 33 行,在 download_jars(datapath=DATAPATH) 文件“/tmp/pip-r6swd0hy-build/setup.py”,第 26 行,在 download_jars urlretrieve(tgz_url, tgz_name) 文件“/Users/duncan/anaconda/lib/python3.5/urllib /request.py”,第 188 行,在 urlretrieve 中,使用 contextlib.closing(urlopen(url,data)) 作为 fp:文件“/Users/duncan/anaconda/lib/python3.5/urllib/request.py”,第 163 行,在 urlopen 返回 opener.open(url, data, timeout) 文件“/Users/duncan/anaconda/lib/python3.5/urllib/request.

----------------------------------------

命令“python setup.py egg_info”在 /tmp/pip-r6swd0hy-build/ 中失败,错误代码为 1

我见过几个对我不起作用的解决方案(例如:谷歌更改了模块的 URL)如果有人有解决方案,我将不胜感激!

我的平台是 16GB El Capitan,但我在 Ubuntu 和其他平台上看到过这个报告。感谢您在这里的任何帮助!

4

2 回答 2

1

我只是从这里的code.google.com分叉并重新下载boilerpipe-1.2.0-bin.tar.gz到我的存储库中https://github.com/slaveofcode/boilerpipe3

您可以使用 pip 安装锅炉管道

pip install boilerpipe3

或通过项目存储库

pip install git+ssh://git@github.com/slaveofcode/boilerpipe3@master
于 2016-10-22T20:48:14.070 回答
0

我遇到了同样的问题,这是因为锅炉管道 URL 已被移动。我通过在 pypi 的安装 tar.gz 中更改 setup.py 中的这一行来解决它:

旧线:
tgz_url = 'https://boilerpipe.googlecode.com/files/boilerpipe-{0}-bin.tar.gz'.format(version)

新队:
tgz_url = 'https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/boilerpipe/boilerpipe-{0}-bin.tar.gz'.format(version)

重新压缩整个文件夹并在新的压缩目录上运行 pip install。

于 2016-10-20T10:36:20.500 回答