问题标签 [wget]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
4783 浏览

php - wget 返回下载的文件名

我在 php 脚本中使用 wget,需要获取下载文件的名称。

例如,如果我尝试

我将在下载目录中获得一个名为 index.html 的文件。

编辑:该页面并不总是谷歌,目标可能是图像或样式表,所以我需要找出下载的文件的名称。

我想要这样的东西:

0 投票
3 回答
4444 浏览

php - 如果wget遇到404错误,php如何检测?

我正在通过 php 的 shell_exec() 运行 wget 我怎么能理解 wget 获取文件时出现 404 错误?

谢谢你。

0 投票
2 回答
1535 浏览

php - 使用 WGet 下载 HTML 和图像,无需前几行

我正在尝试使用wget-p 选项来下载特定文档和 HTML 中链接的图像。

问题是,托管 HTML 的站点在 HTML 之前有一些非 html 信息。这导致wget不将文档解释为 HTML 并且不搜索图像。

有没有办法wget剥离前 X 行和/或强制搜索图像?

示例网址:

第一行内容:

最后几行内容:

编辑:当然接受 PHP 中的解决方案。

0 投票
3 回答
2261 浏览

ruby - 如何抓取 _private_ google 群组?

我想抓取一个私人谷歌小组的讨论列表。这是一个多页列表,我以后可能不得不再次这样做,所以脚本听起来像是要走的路。

由于这是一个私人组,我需要先登录我的谷歌帐户。不幸的是,我无法使用 wget 或 ruby​​ Net::HTTP 登录。令人惊讶的是,客户端登录界面无法访问 google 群组,因此所有代码示例都无用。

我的 ruby​​ 脚本嵌入在帖子的末尾。对身份验证查询的响应是 200-OK,但响应标头中没有 cookie,并且正文包含消息“您的浏览器的 cookie 功能已关闭。请打开它。”

我用 wget 得到了相同的输出。请参阅此消息末尾的 bash 脚本。

我不知道如何解决这个问题。我错过了什么吗?任何的想法?

提前致谢。

约翰

这是红宝石脚本:

这是 bash 脚本:

0 投票
3 回答
6967 浏览

unix - Hudson 触发器远程构建给出了禁止的 403 错误

我在部署 hudson 的同一台机器上有一个 shell 脚本,在执行它时,它会在 hudson 构建触发器 URL 上调用 wget。由于它是同一台机器,我以http://localhost:8080/hudson/job/jobname/build?token=sometoken 访问它

通常,这应该会触发项目的构建。但是当我这样做时,我得到了 403 禁止。有人知道为什么吗?我已经使用浏览器进行了尝试,它触发了构建,但是通过命令行它似乎不起作用。有任何想法吗?

0 投票
4 回答
2867 浏览

linux - wget .listing 文件,有没有办法指定它的名称

好的,所以我需要运行 wget,但禁止我在需要运行 wget 的位置创建“点”文件。所以我的问题是'我可以让 wget 使用我可以指定的 .listing 以外的名称吗'。

进一步说明:这是将 ftp 文件夹与本地文件夹同步/镜像,因此使用 -O 选项并不是很有用,因为我要求所有文件都保持格式。

0 投票
2 回答
5365 浏览

header - wget 没有任何标题

我想获取没有标题的文件。我尝试了很多事情,比如

如何获取没有标题的任何文件?

0 投票
3 回答
9852 浏览

javascript - 如何启用“wget”以使用 Javascript 下载 HTML 的全部内容

我有一个 要使用 Unix 下载的站点wget。如果您查看文件的源代码和内容,它包含名为“SUMMARY”的部分。但是在发出这样的 wget 命令后:

内容downdloadedtext.txt不完整,与该站点的源代码不同。例如,它不包含摘要部分。是否有正确获取完整内容的正确方法?

我之所以问这个是因为我想从该 HTML 中的不同值自动下载。

0 投票
5 回答
114249 浏览

linux - wget:不要跟随重定向

如何防止wget跟随重定向?

0 投票
1 回答
3184 浏览

ftp - 我将如何构建一个终端命令来从 Media Temple (gs) 服务器下载带有 wget 的文件夹?

我正在尝试在终端上使用 wget 下载一个文件夹(如果这很重要,我使用的是 Mac),因为我的 ftp 客户端很糟糕并且一直超时。它不会长时间保持连接。所以我想知道是否可以使用 wget 通过 ftp 协议连接到服务器以下载有问题的目录。我已经在互联网上搜索了这个并试图编写命令,但它一直失败。所以假设如下:

ftp 用户名是:serveradmin@mydomain.ca ftp 主机是:ftp.s12345.gridserver.com ftp 密码是:somepassword

我尝试通过以下方式编写命令:

当我尝试第一种方法时,我得到了这个错误:

当我尝试第二种方法时,我会走得更远,但出现此错误:

我可能做错了什么?