问题标签 [wget]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - wget 返回下载的文件名
我在 php 脚本中使用 wget,需要获取下载文件的名称。
例如,如果我尝试
我将在下载目录中获得一个名为 index.html 的文件。
编辑:该页面并不总是谷歌,目标可能是图像或样式表,所以我需要找出下载的文件的名称。
我想要这样的东西:
php - 如果wget遇到404错误,php如何检测?
我正在通过 php 的 shell_exec() 运行 wget 我怎么能理解 wget 获取文件时出现 404 错误?
谢谢你。
php - 使用 WGet 下载 HTML 和图像,无需前几行
我正在尝试使用wget
-p 选项来下载特定文档和 HTML 中链接的图像。
问题是,托管 HTML 的站点在 HTML 之前有一些非 html 信息。这导致wget
不将文档解释为 HTML 并且不搜索图像。
有没有办法wget
剥离前 X 行和/或强制搜索图像?
示例网址:
第一行内容:
最后几行内容:
编辑:当然接受 PHP 中的解决方案。
ruby - 如何抓取 _private_ google 群组?
我想抓取一个私人谷歌小组的讨论列表。这是一个多页列表,我以后可能不得不再次这样做,所以脚本听起来像是要走的路。
由于这是一个私人组,我需要先登录我的谷歌帐户。不幸的是,我无法使用 wget 或 ruby Net::HTTP 登录。令人惊讶的是,客户端登录界面无法访问 google 群组,因此所有代码示例都无用。
我的 ruby 脚本嵌入在帖子的末尾。对身份验证查询的响应是 200-OK,但响应标头中没有 cookie,并且正文包含消息“您的浏览器的 cookie 功能已关闭。请打开它。”
我用 wget 得到了相同的输出。请参阅此消息末尾的 bash 脚本。
我不知道如何解决这个问题。我错过了什么吗?任何的想法?
提前致谢。
约翰
这是红宝石脚本:
这是 bash 脚本:
unix - Hudson 触发器远程构建给出了禁止的 403 错误
我在部署 hudson 的同一台机器上有一个 shell 脚本,在执行它时,它会在 hudson 构建触发器 URL 上调用 wget。由于它是同一台机器,我以http://localhost:8080/hudson/job/jobname/build?token=sometoken 访问它
通常,这应该会触发项目的构建。但是当我这样做时,我得到了 403 禁止。有人知道为什么吗?我已经使用浏览器进行了尝试,它触发了构建,但是通过命令行它似乎不起作用。有任何想法吗?
linux - wget .listing 文件,有没有办法指定它的名称
好的,所以我需要运行 wget,但禁止我在需要运行 wget 的位置创建“点”文件。所以我的问题是'我可以让 wget 使用我可以指定的 .listing 以外的名称吗'。
进一步说明:这是将 ftp 文件夹与本地文件夹同步/镜像,因此使用 -O 选项并不是很有用,因为我要求所有文件都保持格式。
header - wget 没有任何标题
我想获取没有标题的文件。我尝试了很多事情,比如
如何获取没有标题的任何文件?
javascript - 如何启用“wget”以使用 Javascript 下载 HTML 的全部内容
我有一个 要使用 Unix 下载的站点wget
。如果您查看文件的源代码和内容,它包含名为“SUMMARY”的部分。但是在发出这样的 wget 命令后:
内容downdloadedtext.txt
不完整,与该站点的源代码不同。例如,它不包含摘要部分。是否有正确获取完整内容的正确方法?
我之所以问这个是因为我想从该 HTML 中的不同值自动下载。
linux - wget:不要跟随重定向
如何防止wget跟随重定向?
ftp - 我将如何构建一个终端命令来从 Media Temple (gs) 服务器下载带有 wget 的文件夹?
我正在尝试在终端上使用 wget 下载一个文件夹(如果这很重要,我使用的是 Mac),因为我的 ftp 客户端很糟糕并且一直超时。它不会长时间保持连接。所以我想知道是否可以使用 wget 通过 ftp 协议连接到服务器以下载有问题的目录。我已经在互联网上搜索了这个并试图编写命令,但它一直失败。所以假设如下:
ftp 用户名是:serveradmin@mydomain.ca ftp 主机是:ftp.s12345.gridserver.com ftp 密码是:somepassword
我尝试通过以下方式编写命令:
当我尝试第一种方法时,我得到了这个错误:
当我尝试第二种方法时,我会走得更远,但出现此错误:
我可能做错了什么?