问题标签 [urllib2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
82617 浏览

python - 如何在 HTTP 请求中发送带有 urllib2 的自定义标头?

使用 urllib2.urlopen(..) 时,我想在我的请求中发送一个自定义的“Accept”标头。我怎么做?

0 投票
2 回答
4419 浏览

python - 在 Python 中接受文件参数(从发送到上下文菜单)

我将首先指出我几乎没有 python 经验。

替代文字 http://www.aquate.us/u/9986423875612301299.jpg

您可能知道,只需在 Windows PC 上的“发送到”文件夹中放置一个快捷方式,您就可以允许程序将文件作为参数。

我将如何编写一个将此文件作为参数的python程序?

而且,如果有人有机会,作为奖励——我如何将它与 urllib2 集成以将文件发布到我服务器上的 PHP 脚本?

提前致谢。

编辑——另外,我如何在 Sendto 菜单中显示一些东西?我的印象是,您只需将快捷方式放入 SendTo 文件夹,它就会自动在菜单中添加一个选项……没关系。我发现我做错了什么:)

0 投票
3 回答
17574 浏览

python - Python urllib2 文件上传问题

我目前正在尝试使用 urllib2 和urllib2_file库启动文件上传。这是我的代码:

我已将此 .py 文件放在我的“我的文档”目录中,并在我的“发送到”文件夹中放置了它的快捷方式(快捷方式 URL 为 )。

当我右键单击一个文件,选择发送到,然后选择 Aquate (my python) 时,它会在瞬间打开一个命令提示符,然后将其关闭。什么都没有上传。

我知道可能发生了错误,所以我将代码逐行输入到 CL python 中。当我跑u=urllib2.urlopen(req)线时,我没有收到错误; 替代文字 http://www.aquate.us/u/55245858877937182052.jpg

相反,光标只是在该行下方的新行上开始闪烁。我等了几分钟,看看是否会发生什么事情,但它就是这样。为了让它停止,我不得不按 ctrl+break。

这个脚本是怎么回事?

提前致谢!

[编辑] 忘了提——当我在没有请求数据(文件)的情况下运行脚本时,它运行起来就像一个魅力。urllib2_file 有问题吗?

[编辑 2]:

如果您通过命令行运行该代码,它就像一个魅力。

0 投票
2 回答
1068 浏览

python - Python 中的 Cookie 问题

我正在为 python 2.6 中的 Hulu 开发一个简单的 HTML 抓取工具,并且在登录我的帐户时遇到问题。到目前为止,这是我的代码:

代码编译并运行,但打印的只是:

我认为我处理 cookie 的方式存在一些错误,但似乎无法发现它。我听说 Mechanize 是此类程序的一个非常有用的模块,但由于这似乎是剩下的唯一减速带,我希望能找到我的错误。

0 投票
1 回答
5403 浏览

python - 使用 urllib2 进行节流

使用时是否可以轻松限制 kbps urllib2?如果是这样,您可以指导我访问的任何代码示例或资源将不胜感激。

0 投票
2 回答
353 浏览

python - 使用 urllib2.urlopen() 下载 .rar 文件时缺少第一行

好吧,这真的很奇怪。我有这个脚本,它基本上下载了一堆实现文件并提取它们。通常这些文件是 .zip 文件。今天我坐下来决定让它与 rar 文件一起工作,但我卡住了。起初我认为问题出在我的解压缩代码中,但它不存在。所以我做了:

哎呀,我什至做了:

因为我只是想查看第一个块,结果是一样的——我缺少 .rar 文件的第一行。

如果我使用网络浏览器下载相同的文件,一切都很好,它没有损坏。

谁能解释一下这里到底发生了什么?它与文件类型有什么关系。

0 投票
4 回答
42701 浏览

python - 如何防止 Python 的 urllib(2) 跟随重定向

我目前正在尝试使用 Python 登录一个站点,但是该站点似乎在同一页面上发送了一个 cookie 和一个重定向语句。Python 似乎遵循该重定向,因此阻止我读取登录页面发送的 cookie。如何防止 Python 的 urllib(或 urllib2)urlopen 跟随重定向?

0 投票
8 回答
14380 浏览

python - 如何在 urllib2 请求中获取默认标头?

我有一个使用 urllib2 的 Python Web 客户端。将 HTTP 标头添加到我的传出请求中很容易。我只是创建一个我想要添加的标题的字典,并将它传递给 Request 初始化程序。

但是,其他“标准”HTTP 标头以及我明确添加的自定义标头都会添加到请求中。当我使用 Wireshark 嗅探请求时,除了我自己添加的标题之外,我还看到了标题。我的问题是如何访问这些标头?我想记录每个请求(包括全套HTTP 标头),但不知道如何。

任何指针?

简而言之:如何从 urllib2 创建的 HTTP 请求中获取所有传出标头?

0 投票
3 回答
1394 浏览

python - 如何调试文件上传?

我正在尝试使用 Python 脚本使用 Hot Banana 的内容管理系统将 PDF 文件上传到网站。我已成功登录该站点并可以注销,但我似乎无法正常上传文件。

文件上传是大型复杂网络表单的一部分,该表单通过 POST 提交表单数据和 PDF 文件。使用 Firefox 以及 Firebug 和 Tamper Data 扩展,我查看了浏览器在 POST 中发送的内容以及它的去向。我相信我模仿了浏览器在代码中发送的数据,但我仍然遇到问题。

我正在导入 cookielib 来处理 cookie、poster 来编码 PDF,以及 urllib 和 urllib2 来构建请求并将其发送到 URL。

注册海报开瓶器是否有可能破坏 cookie 处理器开瓶器?我这样做完全错了吗?


编辑:调试过程的好方法是什么?目前,我只是将 urllib2 响应转储到文本文件并检查输出以查看它是否与我手动上传文件时得到的匹配。

编辑 2:Chris Lively 建议我发布我遇到的错误。来自 urllib2 的响应不会产生异常,而只是返回:

我会坚持下去的。

0 投票
6 回答
66145 浏览

python - 使用 MultipartPostHandler 通过 Python 发布表单数据

问题:当使用 Python 的 urllib2 发布数据时,所有数据都经过 URL 编码并作为 Content-Type: application/x-www-form-urlencoded 发送。上传文件时,Content-Type 应该设置为 multipart/form-data 并且内容是 MIME 编码的。

为了解决这个限制,一些敏锐的编码人员创建了一个名为 MultipartPostHandler 的库,它创建了一个 OpenerDirector,您可以将其与 urllib2 一起使用,以自动使用 multipart/form-data 进行 POST。这个库的副本在这里:MultipartPostHandler doesn't work for Unicode files

我是 Python 新手,无法让这个库正常工作。我基本上写了以下代码。当我在本地 HTTP 代理中捕获它时,我可以看到数据仍然是 URL 编码的,而不是多部分 MIME 编码的。请帮助我找出我做错了什么或更好的方法来完成这项工作。谢谢 :-)

EDIT1:感谢您的回复。我知道 ActiveState httplib 解决方案(我在上面链接到它)。我宁愿抽象出问题并使用最少的代码来继续使用 urllib2。知道为什么没有安装和使用开瓶器吗?