问题标签 [downloading-website-files]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 使用python下载文件的问题
我正在尝试从该站点下载一些 jpg 并将它们保存在我的硬盘驱动器上,但是当我这样做时,由于格式问题,我无法打开文件,所有这些文件由于某种原因也有 115kb。
我尝试更改块大小并使用 request() 进行了一些操作,但没有成功。外壳中没有错误。该网站的链接是正确的。
解决方案(在 'for i...' 循环中):
linux - 从远程网站下载 PDF 文件
如何下载网站中的所有 PDF 文件?在这里,我不想使用 wget 命令,因为它需要手动操作并且需要花费大量时间。
excel - 使用 VBA-Excel 从受保护的网站下载文件
我正在尝试从受保护的网页下载文件(来自我的工作,所以我无法发布网址)。
当我在 .xls 中保存字节(我正在使用 WinHTTP 请求)时,文件似乎已损坏。
我的代码(没有敏感信息)和“HTTP Header Live”采用的一些代码。
代码运行。我在所有检查状态下都得到“OK”,但是当我尝试打开文件(有 622kb,与手动下载相同)时,Excel 会提示我一条消息,指出单元格的数据过多。如果我点击“仍然打开”,我可以阅读一些部分。
看起来文件正在以不同的编码保存。
来自 HTTP Header Live 的一些代码。
登录:
https
://www.website.com/retro/logincheck.asp 主机:www.website.com
用户代理:Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:70.0) Gecko/20100101 Firefox/70.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9, / ;q=0.8
Accept-Language: es-ES,es;q=0.8,en-US;q=0.5,en;q =0.3
Accept-Encoding: gzip, deflate, br
Content-Type: application/x-www-form-urlencoded
Content-Length: 38
Origin: https://www.website.com
Connection: keep-alive
Referer: https:// /www.website.com/retro/default.asp?idioma=ES
Cookie:cc_social=yes;cc_analytics=是;cc_advertising=是;cc_necessary=是;_ga=GA1.2.859443177.1570897852; __utma=136336428.859443177.1570897852.1570897852.1570897852.1;__utmz=136336428.1570897852.1.1.utmcsr=google|utmccn=(有机)|utmcmd=有机| utmctr=(未提供%20); ASPSESSIONIDQWSBSQAD=LDIIIENCGKDHMEJEGKJKBDMM; cookieconsent=解雇;ASPSESSIONIDQWQCRRBD=PCOIENHDNLHCKNODMJLKAFGM
Upgrade-Insecure-Requests: 1
txtUser=MYUSER&txtpwd=MYPASS&lg=es
POST: HTTP/2.0 302 发现
日期: Wed, 04 Dec 2019 22:20:17 GMT
server: Microsoft-IIS/8.5
cache-control: private
content -type: text/html
expires: Wed, 04 Dec 2019 22:20:18 GMT
位置:retro.asp
内容长度:130
via:2.0 www.website.com
X-Firefox-Spdy:h2
文件:
https: //www.website.com/retro/VerBorderoGRxls.asp? id=27348&p=3º Trimestre 2019&n=0&m=UNKNOWN&con=CIRCULAR&fmt=xls
主机:www.website.com
用户代理:Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:70.0) Gecko/20100101 Firefox/70.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9, / ;q=0.8
Accept-Language: es-ES,es ;q=0.8,en-US;q=0.5,en;q=0.3
Accept-Encoding: gzip, deflate, br
Connection: keep-alive
Referer: https://www.website.com/retro/borderos_resumen.asp
Cookie:cc_social=yes;cc_analytics=是;cc_advertising=是;cc_necessary=是;_ga=GA1.2.859443177.1570897852; __utma=136336428.859443177.1570897852.1570897852.1570897852.1;__utmz=136336428.1570897852.1.1.utmcsr=google|utmccn=(有机)|utmcmd=有机| utmctr=(未提供%20); ASPSESSIONIDQWSBSQAD=LDIIIENCGKDHMEJEGKJKBDMM; cookieconsent=解雇;ASPSESSIONIDQWQCRRBD=PCOIENHDNLHCKNODMJLKAFGM
升级-不安全-请求:1
GET:HTTP/2.0 200 OK
日期:2019 年 12 月 4 日星期三 22:21:40 GMT
服务器:Microsoft-IIS/8.5
缓存控制:私有
内容类型:应用程序/x-msexcel
过期:2019 年 12 月 4 日,星期三 22:格林威治标准时间 21:40
内容长度:637440
通过:2.0 www.website.com
X-Firefox-Spdy:h2
java - 我们需要捕获 AsyncTask 的返回值吗?
我在下面写了一个异步任务
这里 AsyncTask 返回一个string
值。在onCreate
我调用这个 AsyncTask 的对象的方法中
此代码可以正常工作。但我怀疑我们是否需要一个字符串类型的变量来捕获 AsyncTask 的返回值。这里没有使用变量,它只是写成task.execute("https://hacker-news.firebaseio.com/v0/topstories.json?print=pretty");
. 为什么这不会引发错误。谁能解释一下。我是安卓新手。
python-3.x - urllib.error.HTTPError:HTTP 错误 404:使用 request.urlopen() 时未找到
我正在关注教程,使用时request.urlopen(url)
出现错误,我尝试检查 URL(https://www.wsj.com/market-data/quotes/PH/XPHS/JFC/historical-prices/download?MOD_VIEW= page&num_rows=150&range_days=150&startDate=06/01/2020&endDate=07/05/2020),没关系。
这是我的代码:
我在控制台中得到的错误是:
java - 使用 Java 从站点下载所有图像的最佳方法?当前收到 403 状态错误
我正在尝试从站点下载所有图像,但我不确定这是否是最好的方法,因为我尝试设置用户代理和引荐来源网址无济于事。403 状态错误仅在尝试从 src 页面下载图像时发生,而将所有图像放在一个位置的页面不会显示任何错误并将 src 发送到图像。我不确定是否有办法在不访问 src 页面的情况下下载图像?或者更好的方法来完全做到这一点。到目前为止,这是我的代码。
php - 如何在wordpress中限制pdf、doc和ppt的下载
我正在 Wordress 中建立一个网站,我正在 wordpres 页面上上传 Doc、PPT 和 Pdf 文件以供用户查看,但我想限制它们被下载。任何帮助表示赞赏。提前致谢
angularjs - 内容下载(CSS、JS 等)花费太多时间,导致加载速度太慢
我正在研究一个弹簧框架项目优化。加载需要 2 分钟以上。当我检查网络控制台时,主要原因是 js、css 内容下载。下载 200KB 文件需要 2 分钟。每 1KB 需要 2-8 秒才能下载(其他文件)。
生成的 .war 文件在 webroot 中重新定位那些 css、js 文件但没有任何改进。我应该在哪里调查以找到内容下载的延迟?直接在 .war 文件中修改 .jsp 文件会有帮助吗?它不在本地主机中,我将其部署在用户验收测试服务器(UAT)中。
技术栈:Spring 框架、Angular、GWT。
asp.net - 从 aspx 网页打开或下载 excel 文件失败:它没有在应用程序中打开
我们有一个将基于 ActiveReport 的报告转换为 Excel 文件的解决方案。基本上这工作得很好,但在某些环境中,由于某些非常奇怪的原因,Excel 文件的下载没有开始,并且 Excel 文件在 Web 浏览器窗口中打开,而不是询问用户是否要打开或保存生成的 Excel 文件.
我们的应用程序在基于 Windows Server 2019 的虚拟机上运行。但是,如果我从其他计算机连接到该虚拟机上的 Web 服务器并打开相同的应用程序并将相同的报告导出到 Excel 文件中,一切正常。Web 浏览器询问我是否要保存或打开 Excel 文档,我可以将其打开到 Excel 或 Excel 查看器。
更奇怪的是,这个问题并没有出现在每个运行相同应用程序的服务器上。看起来,如果服务器上只安装了 Microsoft Office Excel 查看器,就会出现这些问题 - 但并非在所有情况下都如此。如果安装了完整版的 Excel,似乎没有问题。
我们已经尝试了我们发现的一切。我们已经设置了浏览器标志(https://docs.microsoft.com/en-US/troubleshoot/browsers/how-to-set-ie-to-open-office-documents-in-office-program和https:// /www.thewindowsclub.com/make-internet-explorer-open-linked-office-documents-in-the-appropriate-office-program)并浏览了数十个网页并重新安装了Excel Viewer。
尽管如此,这个问题似乎根本与浏览器标志无关,因为这在其他服务器中工作正常,即使浏览器标志值未在注册表项中设置。
所以,对我来说,问题似乎出在服务器上的网络浏览器设置中。我只是无法想象在哪里。服务器上安装的网络浏览器是 IE 11。
非常感谢任何帮助。
编辑:
正如我在评论中解释的那样,我发现发生此问题的此应用程序的版本存在差异。
版本之间的区别是:
编辑 2:我在安装了 Microsoft Excel 2016 和 Microsoft Office Excel Viewer 的服务器上对此进行了测试。此导出 Excel 文件的网页也安装在该服务器上。我测试的应用程序使用了这种内容类型设置:
首先,安装 Excel 后,Excel 导出工作正常。当我选择“打开”时,使用导出的 Excel 文件打开了 Excel 2016。
然后我卸载了 Excel。相同的 Excel 导出的行为与本案例开头所解释的一样:Excel Viewer 未打开并且 Excel“文件”在浏览器窗口中打开。
能解释这一点的人将获得奖励。
php - 如何使用 PHP 下载大文件
我试图通过使用一些在线可用的 PHP 代码从网络链接下载 7GB .tar文件到我的网络服务器。但是,文件在达到 4GB 左右时停止下载。
我的网络服务器有无限的存储空间,那么是什么导致了这个问题?
有没有办法不停地下载这么大的文件?
或者为此目的的任何网络服务器软件/插件?
谢谢