问题标签 [urllib2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1947 浏览

python - Python:urllib2 multipart/form-data 和代理

目标:一个脚本,它循环遍历代理列表并发送一个发布请求,其中包含一个文件到我服务器上的 PHP 页面,然后计算交付时间。这是一个非常无用的脚本,但我正在使用它来自学 urllib2。

问题:到目前为止,我已经使用Poster正确发送了 multipart/form-data ,但我无法让它通过代理发送,更不用说代理的循环列表了。我曾尝试将 OpenerDirector 与 一起使用urllib2.ProxyHandler,但我相信Poster它定义了它自己的开瓶器来执行它的魔力。

下面是使用海报发送多部分/表单数据请求的代码。

任何帮助将不胜感激,因为我很难过。

0 投票
3 回答
389 浏览

python - 我只想下载这个网址……但它给了我一个错误!...unicode..(Python)

请看一下 unicode 部分。我已经尝试了这两个选项...但不起作用。

当我尝试更长的编码方法时也是如此......

0 投票
4 回答
8970 浏览

python - urllib2 未检索整个 HTTP 响应

我很困惑为什么我不能使用urllib2从FriendFeed下载一些 JSON 响应的全部内容。

如何使用 urllib2 检索完整响应?

0 投票
2 回答
1603 浏览

python - 如何提交具有多个提交按钮的表单。向网站发送 POST。(Python)

我正在使用Python Mechanize创建一个脚本,该脚本可以登录网站并提交表单。但是,此表单有 3 个提交按钮(预览、发布和取消)。我习惯了只有一个按钮...

这是表格:

这是我的代码:

如果我运行这个脚本......它不会工作。没发生什么事。我假设因为它在表单中有 3 个提交按钮?或者是另一个问题?

0 投票
2 回答
3902 浏览

python - urllib2 可以发出 HTTP/1.1 请求吗?

编辑:

这个问题是无效的。事实证明,即使 urllib/httplib 最初确实在发出 HTTP 1.1 请求,透明代理也在发出向前的 HTTP 1.0 请求。

原始问题:

默认情况下urllib2.urlopen总是发出 HTTP 1.0 请求。

有什么方法可以让它与 HTTP 1.1 对话吗?

0 投票
1 回答
2577 浏览

python - Urllib2 通过代理发送 Post 数据

我已经使用 proxyhandler 配置了一个代理,并发送了一个带有一些 POST 数据的请求:

然后我得到一个 405 http 错误(不允许的方法)

我可以得到一些帮助吗?我无法弄清楚出了什么问题

提前致谢

0 投票
1 回答
1182 浏览

python - 在单独的线程中将不同的 ip 地址绑定到 urllib2 对象

以下代码将指定的 ip 地址全局绑定到主程序中的套接字。

假设主程序有 10 个线程,每个线程都运行一个 urllib2 实例。如何将 10 个不同的 ip 地址绑定到每个 urllib2 对象?

0 投票
4 回答
8402 浏览

python - 如何处理 urllib2 的瘪响应?

我目前使用以下代码来解压缩 urllib2 的 gzipped 响应:

它是否也处理放气响应还是我需要编写单独的代码来处理放气响应?

0 投票
4 回答
19858 浏览

python - 将客户端证书与 urllib2 一起使用

我需要在我的服务器和远程 Web 服务之间创建一个安全通道。我将使用带有客户端证书的 HTTPS。我还需要验证远程服务提供的证书。

  1. 如何将我自己的客户端证书与 urllib2 一起使用?

  2. 我需要在我的代码中做些什么来确保远程证书是正确的?

0 投票
2 回答
1088 浏览

javascript - 使用python检索动态网站的源码(绕过onclick)

我希望检索网站的来源,该来源是在单击链接时动态生成的。链接本身如下:

这使我无法直接查询允许我获取动态生成的网站 (urllib/2) 的 URL。

如何检索网站的来源,它是通过 python 使用上述函数(在 HTML 中)生成的?有没有绕过的方法return false" href="#"?或者onclick完全,并获得实际的 URL?

如果有另一种方法可以从上面的抽象链接生成网站,以便可以从 python 中的 urllib 中获取,请参考我。


编辑:

我概括了上面看到的代码 - 但是我被告知必须对特定的 javascript 进行逆向工程才能使用它。

链接到 .js - http://a.quizlet.com/j/english/create_setku80j8.js

链接到带有链接的网站:

网站实际网址:http: //quizlet.com/create_set/

以上相关.js的美化JS:http: //pastie.org/737042