93

要从服务器下载 SOFA 统计信息,我使用 wget 命令:

wget -c http://sourceforge.net/projects/sofastatistics/files/latest/download?source=dlp

在这种情况下,下载文件的文件名是download?source=files. 如果我--output-document在命令中添加选项,将输出文件重命名为sofastatistics-latest.deb,则 dpkg 包无法识别下载文件的格式。

dpkg-deb: error: `sofastatistics-latest.deb' is not a debian format archive

如何使用 wget 正确重命名下载的文件?

更新 - 2015 年1 月 8 日

通过提供的链接,下载的文件始终是 *.tar.gz 文件。要使用真实姓名,只需添加以下--content-disposition选项(感谢@6EQUJ5!):

wget --content-disposition http://sourceforge.net/projects/sofastatistics/files/latest/download?source=dlp

但是我需要一个 *.deb 文件,所以这里是 @creaktive,我必须搜索 *.deb 文件链接。

感谢大家的回答!

4

4 回答 4

120

将标准输出重定向到任意文件名总是有效的。正如man wget所说,你正在正确地使用 -O

wget http://www.kernel.org/pub/linux/kernel/README -O foo
--2013-01-13 18:59:44--  http://www.kernel.org/pub/linux/kernel/README
Resolving www.kernel.org... 149.20.4.69, 149.20.20.133
Connecting to www.kernel.org|149.20.4.69|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 12056 (12K) [text/plain]
Saving to: `foo'

100%[======================================================================================================================================>] 12,056      --.-K/s   in 0.003s  

2013-01-13 18:59:45 (4.39 MB/s) - `foo' saved [12056/12056]

实际上,您必须在文件中获取 HTML(通常可以使用man file检查)。

[编辑]

在您的情况下,客户端收到302 Found(您可以使用curl -v URL检查它)。

以下 curl 通过尊重 3xx 来解决问题:

$ curl -L http://sourceforge.net/projects/sofastatistics/files/latest/download?source=files -o foo.deb
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
  0   463    0     0    0     0      0      0 --:--:--  0:00:01 --:--:--     0
  0     0    0     0    0     0      0      0 --:--:--  0:00:02 --:--:--     0
100 2035k  100 2035k    0     0   390k      0  0:00:05  0:00:05 --:--:-- 1541k
$ file foo.deb 
foo.deb: gzip compressed data, was "sofastats-1.3.1.tar", last modified: Thu Jan 10 00:30:44 2013, max compression

wget应该有类似的选项来容忍 HTTP 重定向。

于 2013-01-13T18:01:40.333 回答
24

如果您要从 Web 浏览器进行相同的下载,并且您注意到浏览器实际上正确命名了文件,则可以使用该--content-disposition选项为 wget 提供相同的行为:

wget --content-disposition http://sourceforge.net/projects/sofastatistics/files/latest/download?source=dlp

我的 Debian 手册页将此报告为“实验性”功能,但我不记得它对我不起作用:

       --content-disposition
           If this is set to on, experimental (not fully-functional) support for "Content-Disposition" headers is enabled. This can currently result in extra round-trips to the server
           for a "HEAD" request, and is known to suffer from a few bugs, which is why it is not currently enabled by default.

           This option is useful for some file-downloading CGI programs that use "Content-Disposition" headers to describe what the name of a downloaded file should be.
于 2015-01-07T09:36:00.053 回答
1

该链接指向重定向器,而不是最终目的地!因此,您正在下载 HTML 并将其重命名为.deb. 杂乱的页面顶部有这个:

您的下载将在 0 秒后开始... 下载有问题?请使用此直接链接,或尝试其他镜像

现在,是一个有效的链接(注意download前缀): http: //downloads.sourceforge.net/project/sofastatistics/sofastatistics/1.3.1/sofastats-1.3.1-1_all.deb ?r=http%3A%2F %2Fsourceforge.net%2Fprojects%2Fsofastatistics%2Ffiles%2Fsofastatistics%2F1.3.1%2F&ts=1358119361&use_mirror=ufpr

将此 URL 传递给wget. 另外,请注意,SourceForge 试图超越您,通过 User-Agent 字符串来访问操作系统。“wget”的最佳猜测似乎是 .tar.gz 包。所以,你应该更具体,请求 deb 文件!

于 2013-01-13T18:01:22.040 回答
0

这对我有用

  • 在 macOS 上,我wget通过 Homebrew 安装了这个brew install wget
  • 然后我执行这个wget -O ~/Downloads/file.txt https://www.gnu.org
  • 或者这是一样的wget --output-document ~/Downloads/fil.txt https://www.gnu.org
于 2021-11-11T16:50:13.670 回答