问题标签 [urlparse]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
379 浏览

python - 在 Tastypie 中处理 x-www-form-urlencoded 内容?

我使用 jQuery Ajax 将 CkEditor 内联编辑内容发布到 Tastypie。内容包含 HTML 标签和中文字符。这就是我现在所拥有的:

from_urlencode方法很好地处理了英文字符,但是如果有一些中文字符,则会引发错误:

“ascii”编解码器无法解码位置 0 中的字节 0xe6:序数不在范围内(128)

如何解决这个问题?

0 投票
1 回答
2736 浏览

python - 如何在 python 中使用 urlparse 和 split() 解析 URL?

host = parsed.netloc.split('@')[-1].split(':')[0]有人可以在下面的代码中向我解释这一行的目的吗?我知道我们正在尝试从 netlock 获取主机名,但我不明白为什么我们要使用 @ 分隔符拆分,然后再使用 : 分隔符。

当然,如果只需要域,我们可以从 urlparse.netloc 获得

0 投票
1 回答
791 浏览

python - Python将标头添加到urlparse

似乎没有办法将标头添加到 urlparse 命令。这实质上会导致 Python 使用其默认用户代理,该代理被多个网页阻止。我想要做的基本上是做相当于这个:

但是使用 urlparse:

那么如何修改此 urlparse 以使其获取标头,或者可用于我创建的请求?任何帮助表示赞赏,谢谢。

此外,对于任何想知道我得到的确切错误的人:

在这:

0 投票
1 回答
181 浏览

python-2.7 - virtualenv 的 Aptana Python stdlib 问题

      我最近开始使用 vim 作为带有 virtualenv 设置的文本编辑器的项目。我从 GitHub 在这个 virtualenv 上安装了一些 API。最终,项目变得比 vim 可以处理的大一点,所以我不得不将项目移动到 IDE。
      我选择了 Aptana Studio 3。当我启动 Aptana 时,我将项目目录指向了我为存放我的项目而创建的 virtualenv 文件夹。然后我将解释器指向 App/bin(从 virtualenv 创建)/python2.7 中的 Python 可执行文件。当我开始修改代码以确保所有内容都正确映射时,我能够导入我已经安装好的 API。CherryPy 没有问题,但是我在导入一个我认为是 stdlib--urlparse 的一部分的模块时遇到了问题。起初,我以为我的 python 解释器是 2.7.1 而不是 2.7.5(我在 2.7.5 部分找到了文档,没有查看 2.7.1 的选项),但我的终端使用的是 2.7.1 和能够在没有任何错误的情况下导入模块(我使用的是 OSX,Mountain Lion)。当我激活 virtualenv 并运行我的 python 解释器时,我也可以导入模块。但是,当我将“from urlparse import parse_qsl”插入 Aptana 时,出现错误:“Unresolved_import: parse_qsl”。

    我是否应该将其指向不同的解释器,如果是这样,我是否需要重新安装我在新解释器中使用的 API 模块?

0 投票
2 回答
4068 浏览

python - python, "urlparse.urlparse(url).hostname" 返回无值

登录网站后,我想收集其链接。这是我用这个函数做的(使用 mechanize 和 urlparse 库):

我收到此错误消息:

我不确定如何解决这个问题,或者即使它完全可以解决。有没有办法强制函数追加,即使它会为 None 值产生一个不工作和奇怪的结果?

或者,我在链接中真正追​​求的是链接的结尾。例如,其中一个链接的 html 代码如下所示(我所追求的是世界“lexik”):

所以另一种方法是,如果 mechanize 可以直接收集这个值,绕过链接和 None 值的麻烦

0 投票
2 回答
379 浏览

python - Web Crawler 错误:“AttributeError:Spider 实例没有属性‘find’”

我的网络爬虫和 python 的 urlparse 插件有问题。我下面的代码基本上爬取了一个特定的域,例如Bloomberg,并将所有的 html 下载到我的桌​​面。它仍处于早期阶段,所以我相信你会注意到错误等(我是 python 新手。)

我目前遇到的具体问题与功能有关reconstruct_url。我已经urlparse.urljoin(a,b)单独测试了这个函数,它以我期望的方式运行,但是在这个类中它只是不喜欢它。你们中的任何人都可以帮我看看这里有什么问题吗?

如果我的代码中有任何其他问题对您来说非常明显,请随时大声喊出来,这是我第一次尝试编写完整的程序。尽管请注意,这仍处于相对早期的阶段。非常感谢您的帮助。

0 投票
1 回答
146 浏览

python - python urljoin目录不包括

我想修复一些关于 urlparse.urljoin 的情况。像这样使用这个库

给我http://xxxx.yyy/directory/file.file但如果我最后没有在 url 中给出斜线

给了我http://xxxx.yyy/file.file这让我无法编写自动收集程序。任何人都可以解决这个问题。我试图用正则表达式最后加上斜线并替换,但是当 url 完成时这些不能正常工作

0 投票
1 回答
1159 浏览

python - 用于在 python 中使用查询字符串/参数过滤 url 的正则表达式

我有一个代码,它遍历 url 列表以执行一些操作,但输入的 url 必须每个都包含查询字符串,我想首先检查 url 是否正确并且实际上包含查询字符串,我搜索了大部分正则表达式我发现只检查 url,我找到的最接近的解决方案是使用 urlparse 像这样

但我想知道是否可以使用更可靠的正则表达式来完成

0 投票
2 回答
8105 浏览

python - 在 Python 2 中修改 URL 组件

有没有更简洁的方法来修改 Python 2 中 URL 的某些部分?

例如

目前,我正在这样做:

有更清洁的解决方案吗?

0 投票
1 回答
11428 浏览

javascript - 如果 JavaScript 中没有定义协议,如何将 http:// 添加到 URL?

我的问题与这个问题相同,但正确答案是针对 PHP 而不是 JavaScript。

如果 URL 中不存在 http://,如何添加

如果没有http://https://ftp:// ,如何将 http:// 添加到 URL ?

基本上,如何使用 JavaScript 编写使用 PHP 语法的相同函数?因为当我使用函数preg_match时,它没有在 JavaScript 中定义。