问题标签 [downloading-website-files]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何使用 Python 下载 pdf 文件?
我正在寻找一种在 python 中下载 pdf 文件的方法,我看到了其他问题的答案,推荐了 urllib 模块。我尝试使用它下载 pdf 文件,但是当我尝试打开下载的文件时,会显示一条消息,提示无法打开该文件。
这是我使用的代码-
我究竟做错了什么?此外,该文件会自动保存到我的 python 文件所在的目录中。如何更改它的保存位置?
编辑-我再次尝试使用示例 pdf 的链接,http://unec.edu.az/application/uploads/2014/12/pdf-sample.pdf
该代码正在使用此链接,那么为什么它不适用于另一个?
html - 下载 HTML5 视频元素中的文件名
有人知道如何设置html5<video>
标签的文件名吗?我尝试了下载属性,但它只适用于<a>
或<area>
标签。
downloading-website-files - PHP: Downloading pdf file without direct link
I am trying to download pdf file from this url:
I tried get file through file_get_contents, but it downloaded just php file without actual pdf.
Is there a way to download this file?
Thank you very much!
python - 从 txt 文件中列出的 url 下载文件而不使用 wget
由于无法在我的工作中安装 wget 库,我需要一种解决方法来使用 txt 文件中列出的 URL 下载文件。我有一个名为 urls.txt 的 txt 文件,其中包含大约一千个链接,每个链接指向需要下载的文件。到目前为止,我有类似的东西,但不幸的是,尽管正在执行脚本,但它没有下载任何文件。
python - 使用 selenium 进行 Python 3 网页抓取:ui-dialog 切换问题
我是一名学生,对 Python 很陌生。我想从网站下载 pdf 文件(这些是来自不同组织的财务报告),但在此之前我必须完成一些步骤。这是我正在处理的网站:http ://sprawozdaniaopp.mpips.gov.pl/ 这里有很多组织,所以我认为最好下载带有脚本的pdf。首先,我的脚本单击搜索按钮(没有任何条件 - 查找全部)-> 作为整个链接列表加载的效果。当我单击链接时 - > 同一站点上出现较小的窗口(此窗口仅指我单击的组织)。而且 - 这是问题所在 - 我的脚本无法切换到该窗口。我在网上搜索并找到了 driver.switch_to.window 或 driver.switch_to.frame 函数,但它不起作用或我没有正确使用它。恐怕这不是任何框架,而是 ui-dialog(?)。当我单击此窗口上的右键并检查此窗口时,我发现了类似的内容:
不知道如何告诉我的脚本切换到这种对话窗口(?),以使其仅在 2016 年搜索链接“Sprawozdanie merytoryczne”。
这个网站的奇怪之处在于,当我检查链接时,例如:http ://sprawozdaniaopp.mpips.gov.pl/Search/Details/0000000168只有单击左键才能打开它。当我尝试在新标签中打开它时,这是不可能的(为什么?)。效果如下:“'/' 应用程序中的服务器错误。找不到资源。说明:HTTP 404。您正在查找的资源(或其依赖项之一)可能已被删除、更改名称或暂时不可用。请检查以下 URL 并确保拼写正确。"
这是我在 Python 中的脚本:
我附上一些屏幕来说明我的问题。我将非常感谢任何我应该寻找的建议或一些关键词(也许情况很明显,我作为新手并不理解)。问候!
python - 使用链接中的目录在python中下载图像?
我在网站上有一张图片:(示例)
www.testing.com/hello/subfolder/the%20martian%20movie.jpg
当试图在我的 python 程序中将此图像下载到我选择的目录 (Users/Home/Temp) 时,它会在“/subfolder”上找到。如何在不影响我发现的其他图像的情况下忽略这一点?这张图片是唯一一张前面有目录的图片,所有其他 jpg 图像都会显示正确的链接并将我带到该图片并将其下载到我的临时文件夹,只是不是这张,而这一张是唯一的名称中有一个目录。
这是我正在使用的代码:
在 for 循环中,我尝试使用 basename 却没有这样的运气,它仍然会在 /subfolder 上拾取,我认为会尝试创建子文件夹,但 '/subfolder' 是图像链接的一部分!
我收到错误消息
python - 使用python捕获API自动下载文件
我正在尝试在此网址https://freeapi.robtex.com/pdns/reverse/(ip_address_here)上使用 api我是编码新手,所以如果我只是完全使用错误的软件包,我会忍受......当输入带有 IP 地址的 URL 时,它会自动将 json 响应下载为文件并且不显示任何网页。我想将此下载的文件保存到临时目录并保留它以供以后在我的工具中进一步解析。我曾尝试使用 request.get、urlopen 和 urllib,但我只得到响应代码 (200) 而不是实际文件。或者它似乎正在工作,但网站不会连接/响应我的脚本并且它超时。当我在他们的网站上时,我还添加了复制的用户代理标头。主要参数是使用 argparse,因此可以用作命令行工具。函数 getData 是我试图下载文件的地方。
python - 如何在 python 3 中下载带有临时或间接链接的文件?
我一直在尝试从一段时间后更改下载链接的站点下载文件。我尝试使用 wget 模块下载这些文件。它确实适用于文件的直接链接(例如(http://example/file.zip),但它不会从临时链接下载文件,它们会更改并且似乎不是文件的直接链接。这些就像(http://example.com/file/)我必须使用 webbrowser 模块来打开这些链接,以便它会下载这些文件(因为 webbrowser 和下载管理器会下载这些文件)我想直接下载这些文件使用python 3。
(我试过用 urllib 和 requests 模块下载)
excel - 使用 EXCEL vba 下载文件的问题
我正在编写一个 android 应用程序,我需要一个相当大的数据库。我正在使用 Excel 和 vba 来构建这个数据库。我一直在谷歌搜索,为了下载网页(将数据提取到我的数据库),我想出了下面的代码。但它不起作用。它总是返回 downloadResult=2148270085。有人对解决方案有什么好的建议吗?我在 64 位系统上并使用 EXCEL2013 64 位版本。