问题标签 [urllib]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 向文件类型对象添加搜索的廉价方法
PdfFileReader
从 pdf 文件中读取内容以创建对象。
我正在通过 cdn 查询 pdf urllib.urlopen()
,这为我提供了一个类似对象的文件,它没有搜索。PdfFileReader
, 但是使用 seek。
从通过 url 下载的 pdf 创建 PdfFileReader 对象的简单方法是什么。
现在,我能做些什么来避免写入磁盘并通过file()
.
提前致谢。
python - Python urllib.urlopen IOError
所以我在函数中有以下代码行
当我手动调用该函数时,它们工作正常。但是,当我在循环中调用该函数(使用与之前相同的 url)时,我收到以下错误:
有任何想法吗?
编辑更多代码:
python - 从 python 脚本登录 Launchpad
如何在 python 脚本中登录我的 Launchpad 帐户?任何示例代码将不胜感激。
登录网址是https://launchpad.net/+login然后重定向到类似https://login.launchpad.net/fJLVSRbxPfKTpVDr/+decide
提前致谢!
python - 无法下载 youtube 视频
我无法自动检索 Youtube 视频。这是代码。问题是最后一部分。download = urllib.request.urlopen(download_url).read()
有一条错误消息:(感谢 Wooble)
python - Urllib 和并发 - Python
我正在通过WSGI提供 python 脚本。该脚本通过urllib访问 Web 资源,计算资源,然后返回一个值。
问题是urllib 似乎没有处理对精确 URL 的许多并发请求。
一旦请求达到 30 个并发请求,请求就会慢到爬行!:(
帮助将不胜感激!:D
python - 处理 urllib2 的超时?- Python
我在 urllib2 的 urlopen 中使用 timeout 参数。
我如何告诉 Python 如果超时到期,应该引发自定义错误?
有任何想法吗?
python - 使用 Twisted 的 getPage 作为 urlopen?
我想在 webapp 中使用Twisted 非阻塞 getPage方法,但与 urlopen 相比,使用这样的功能感觉相当复杂。
这是我试图实现的一个例子:
用getPage做类似的东西有那么难吗?
python - 从客户端在 Python 中发出 urllib 请求
我编写了一个 Python 应用程序,它使用 urllib2 库发出 Web 请求,之后它会抓取数据。我可以将其部署为 Web 应用程序,这意味着所有 urllib2 请求都通过我的 Web 服务器。由于许多用户的大量 Web 请求,这导致服务器 IP 被禁止的危险。另一种选择是创建一个我不想做的桌面应用程序。有什么方法可以部署我的应用程序,以便我可以通过客户端获取我的网络请求。一种方法是使用 Jython 创建一个小程序,但我读过 Java 小程序只能向部署它的服务器发出 Web 请求,而规避这种情况的唯一方法是创建一个引导我们返回的服务器端代理关于服务器ip被禁止的问题。
这听起来像是不可能的情况,我可能最终会创建一个桌面应用程序,但我想我会问是否有人知道替代解决方案。
谢谢。
python - Python urllib.urlretrieve() 和 wget 的区别
我正在尝试使用 Python 检索一个 500mb 的文件,并且我有一个使用urllib.urlretrieve()
. 我和下载站点之间似乎存在一些网络问题,因为此调用始终挂起并且无法完成。但是,wget
用于检索文件往往没有问题。urlretrieve()
和有什么区别wget
可能导致这种差异?
python - 不提供文件名的 Python 下载
如何使用 python 下载带有进度报告但不提供文件名的文件。
我试过 urllib.urlretrieve 但我似乎必须为下载的文件提供一个文件名才能另存为。
例如:
我不想提供这个:
只是这个:
但如果我这样做,我会收到此错误:
也无法从某些 URL 示例中获取文件名:
http://www.mozilla.com/products/download.html?product=firefox-3.6.3&os=win&lang=en-US