问题标签 [urlparse]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
9 回答
61795 浏览

php - 你如何从php中的URL中去除域名?

我正在寻找一种方法(或函数)来去除输入函数的任何 URL 的 domain.ext 部分。域扩展名可以是任何东西(.com、.co.uk、.nl、.whatever),输入的 URL 可以是从http://www.domain.com到 www.domain.com/path的任何东西/script.php?=随便

这样做的最佳方法是什么?

0 投票
6 回答
18034 浏览

python - 使用 urlparse (Python) 解析自定义 URI

我的应用程序创建自定义 URI(或 URL?)来识别对象并解析它们。问题是 Python 的 urlparse 模块拒绝像解析 http 那样解析未知的 URL 方案。

如果我不调整 urlparse 的 uses_* 列表,我会得到:

这就是我所做的,我想知道是否有更好的方法来做到这一点:

为什么没有更好的方法来做到这一点?

0 投票
2 回答
1032 浏览

python - Python urlparse,正确还是不正确?

Python 的 urlparse 函数将一个 url 解析为六个组件(scheme、netloc、path 和其他东西)

现在我发现解析“example.com/path/file.ext”不返回netloc,而是返回路径“example.com/path/file.ext”。

不应该是 netloc = "example.com" 和 path = "/path/file.ext" 吗?

我们真的需要一个“://”来确定是否存在 netloc 吗?

Python的票:http ://bugs.python.org/issue8284

0 投票
3 回答
279 浏览

php - 解析爬虫的 url

我正在编写一个小型爬虫,在获取链接的同时提取大约 5 到 10 个站点我得到了一些这样的 url

如果是,/test/index.html我们可以添加基本 urlhttp://www.example.com/test/index.html

我能为这种网址做些什么。

0 投票
2 回答
10310 浏览

python - 将 url 与 urlunparse 结合

我正在写一些东西来“清理”一个 URL。在这种情况下,我要做的就是返回一个伪造的方案,因为urlopen没有它就行不通。但是,如果我用它测试www.python.org它会返回http:///www.python.org。有谁知道为什么会有额外的 /,有没有办法在没有它的情况下返回它?

0 投票
4 回答
2203 浏览

python - Python urlparse:小问题

我正在制作一个解析 html 并从中获取图像的应用程序。使用 Beautiful Soup 和下载 html 很容易解析,并且图像也适用于 urllib2。

我确实对 urlparse 有问题,无法从相对路径中创建绝对路径。这个问题最好用一个例子来解释:

如您所见, urlparse 并没有带走 ../ 。当我尝试下载图像时,这会出现问题:

有没有办法在 urllib 中解决这个问题?

0 投票
1 回答
316 浏览

python - 强制 urlparse.urlsplit 保留 str 大小写

有没有办法强制 urlparse 的 urlsplit 函数保留传入的 str 的大小写?它保留了返回元组中路径的大小写,但不保留 netloc 的大小写,这对我很重要。(我知道域名不区分大小写,但是,我们正在使用不同的名称大写进行一些 A/B 测试,并且需要保留大小写。)

谢谢。

0 投票
4 回答
1885 浏览

python - Python 的 `urlparse`:将 GET 关键字添加到 URL

我正在这样做:

我明白了:

虽然我想得到这个:

我究竟做错了什么?

0 投票
2 回答
3526 浏览

python - 如何使用 Python 2.6 解析 utf-8 编码的查询参数

我的网站上有一些可爱的(斯堪的纳维亚人?)用户抱怨我无法在 URL 中解析他的用户名,因此我在我的网站上的页面上没有向他显示任何结果。

我很确定浏览器将请求编码为 http://councilroom.com/player?player=G%C3%B6rling

我想让播放器字符串成为 Görling 而不是被转换为的 Görling。

我正在将 web.py 与 python 2.6 一起使用,并尝试按如下方式解析 URL

编辑:在 unutbu 的帮助下,我将其更改为

我认为 webpy 以某种方式错误地解析了 web.ctx 中的完整路径,但 QUERY_STRING 变量没有受到干扰。

0 投票
2 回答
5089 浏览

python - Python - 解析 URL 的字符串并提取它们

我知道使用 urllib 你可以解析一个字符串并检查它是否是一个有效的 URL。但是如何去检查一个句子中是否包含一个 URL,然后提取那个 URL。我已经看到了一些巨大的正则表达式,但我宁愿不使用我真的无法理解的东西。

所以基本上我有一个输入字符串,我需要找到并提取该字符串中的所有 URL。

有什么干净的方法来解决这个问题。