0

我正在使用WARC Tools,这是一个用于处理 WARC 文件的 python 库。我已经安装了所有东西,除了最后一个命令外,一切似乎都可以工作。虽然我怀疑你们中的许多人可能没有使用过这个工具,但也许你可以为我理解错误消息。

当我运行这个命令时:

python /path/filesdump.py filtered.warc根据文档,我立即收到此错误消息:

html/811cac8c-7430-403b-96a4-7d77137b0d46.html
Traceback (most recent call last):
  File "/users/ianmilligan1/desktop/warc/warc-tools-mandel/filesdump.py", line 63, in <module>
    sys.exit(main(sys.argv))
  File "/users/ianmilligan1/desktop/warc/warc-tools-mandel/filesdump.py", line 34, in main
    dump_archive(fh,name)
  File "/users/ianmilligan1/desktop/warc/warc-tools-mandel/filesdump.py", line 57, in dump_archive
    txt = record.filedump(content=True)
  File "/Users/ianmilligan1/Desktop/WARC/warc-tools-mandel/warctools/record.py", line 140, in filedump
    p = Popen(['lynx', '-dump', '-stdin', '-nomargins', '-unique_urls', '-width=120'], stdout=PIPE, stdin=PIPE, stderr=STDOUT)
  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/subprocess.py", line 679, in __init__
    errread, errwrite)
  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/subprocess.py", line 1228, in _execute_child
    raise child_exception
OSError: [Errno 2] No such file or directory

这里发生了什么?你会建议我从哪里开始寻找?

4

1 回答 1

1

您需要安装lynx,这是 WARC Tools 似乎需要的命令行 Web 浏览器。这样就解决了。

发生的事情是 warctools/record.py 在第 140 行调用 lynx,而 Python 的子进程库没有找到 lynx 可执行文件,因此它抛出了异常。他们真的应该包装异常并提供更清晰的信息......无论如何。尝试一下,看看它是否可以解决它。

于 2012-12-14T03:13:51.133 回答