问题标签 [urlparse]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
8 回答
11043 浏览

python - Python中的URL解析-规范化路径中的双斜杠

我正在开发一个需要解析 HTML 页面中的 URL(主要是 HTTP URL)的应用程序——我无法控制输入,并且正如预期的那样,其中一些有点混乱。

我经常遇到的一个问题是 urlparse 在解析和连接在路径部分有双斜杠的 URL 时非常严格(甚至可能有问题?),例如:

http://www.example.com//path我最终得到的是http://path.

顺便说一句,我运行此类代码的原因是因为这是迄今为止我发现从 URL 中剥离查询/片段部分的唯一方法。也许有更好的方法可以做到这一点,但我找不到。

任何人都可以推荐一种避免这种情况的方法,还是我应该使用(相对简单,我知道)正则表达式自己规范化路径?

0 投票
2 回答
447 浏览

python - 用python分割路径

我试图在最后一个小数点后切断所有内容并将“html”添加到末尾

html

当前代码返回“gen.1.ceb”

我想让名字得到“gen.1.html”

0 投票
2 回答
7661 浏览

python - 什么是 URL 参数?(urlparse 结果中位置 #3 的元素)

我查看了urlparse.urlparse方法文档,我对这部分是什么有点困惑parameters(不要与更熟悉的query部分混淆,即问号之后和片段部分之前的部分)。

关于 URL 结构的 Wikipedia 条目没有说明任何内容,所以请任何人对此进行详细说明并可能给出一些示例?

0 投票
3 回答
2377 浏览

php - 如何使用 PHP 在 URL 中插入附加路径?

假设我有这个网址:

http://example.com/image-title/987654/

我想将“下载”插入“图像标题”和“987654”之间的部分,所以它看起来像:

http://example.com/image-title/download/987654/

帮助将不胜感激!谢谢你。

0 投票
3 回答
66065 浏览

python - 从python中的URL获取查询字符串的最佳方法?

我需要从此 URL https://stackoverflow.com/questions/ask?next=1&value=3获取查询字符串,并且我不想使用request.META。我发现还有两种获取查询字符串的方法:

  1. 使用 urlparse urlparse.urlparse(url).query

  2. 使用 url 编码 使用 urlencode 并将 request.GET 参数字典传递给它以获取字符串表示形式。

那么哪种方式更好呢?我的同事更喜欢 urlencode,但没有提供令人满意的解释。他们声称 urlparse 在内部调用 urlencode ,这是我不确定的,因为 urlencode 存在于 urllib 模块中。

0 投票
1 回答
18839 浏览

python - 从 url 解析查询部分

我想从 url 解析查询部分,这是我的代码:

这段代码看起来不错,但“parse_qs”方法会丢失“param1”或“param1=”等查询参数。我可以用标准库解析查询部分并保存所有参数吗?

0 投票
2 回答
768 浏览

python - Python urlparse.unparse_qsl?

在 Python 的 urlparse 中,可以使用 urlparse 来解析 URL,然后 parse_qsl 来解析查询。

我想删除一个查询(名称,值)对,然后重建 URL。

有一个 urlunparse 方法,但没有 unparse_qsl 方法。

从 qsl 列表重建查询的正确方法是什么?

0 投票
2 回答
137 浏览

python - 基于 Python CSV 行值的流控制

我正在使用具有以下结构的 CSV:

数据是我浏览历史的清理转储。我有兴趣计算每天的前五个唯一域。这是我到目前为止所拥有的:

使用 d、dt 和 dd,我将日期和时间分开。对于上面的示例行,dt = 20:03:15,dd = 2012-09-01。“if (dt < "090000") and (dt > "060000")” 只是说我只对计算早上 6 点到 9 点之间访问的网站感兴趣。我怎么说“只计算每天早上 6 点之前访问的前五个网站”?任何一天都有数百行,并且这些行按时间顺序排列。

0 投票
2 回答
9980 浏览

python - Python:如何检查字符串是否是有效的 IRI?

是否有检查IRI的标准功能,以检查我可以使用的 URL:

我使用包含 Unicode 字符的 URL 尝试了上述操作:

我得到的是yes an url。这是否意味着我可以很好地测试有效的 IRI?还有其他方法吗?

0 投票
1 回答
8906 浏览

python - 将参数值添加到烧瓶python中的url

我有以下 url 的代码:http://localhost/summary/myfile.csv 我希望 url 看起来像这样:http://localhost/summary?file=myfile.csv

代码要写在烧瓶中。

我的第一个网址的代码如下: