问题标签 [urlparse]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
466 浏览

spring - 重用 Spring RequestMapping 解析功能

我有一些属性,例如 /my/{custom}/url

我需要在运行时用一些值替换 {custom}

我知道 Spring 正在使用具有类似语法的“@RequestMapping”来进行@PathAttribute 匹配。

我想知道是否有一些我可以从 Spring 中重用的类来实现我所需要的。

0 投票
4 回答
26205 浏览

python - 如何使用 `urlparse` 检查 URL 是否有效?

在打开 URL 以读取数据之前,我想检查 URL 是否有效。

我正在使用包中的urlparse功能urlparse

但是,我注意到一些有效的 URL 被视为损坏,例如:

此 URL 有效(我可以使用浏览器打开它)。

有没有更好的方法来检查 URL 是否有效?

0 投票
1 回答
46 浏览

python - 使用 urlparse 删除某个字符串?

我有这个网址:

我想把它转换成

请注意我使用的是 python 2.7。

返回www.domain.com/a/b/c/d,authorised=false.html,但我不知道如何authorised=false从 URL 中删除部分

0 投票
4 回答
2803 浏览

python - 如何在 urlparse 中用新值替换查询?

所以我有一个数据如下:

使用 urlparse 模块。如何用新大小替换上述数据,使其看起来像这样:

0 投票
2 回答
1365 浏览

python - 绝对路径没有前导斜杠时的 urljoin

一些网站,如http://www.gilacountyaz.gov/government/assessor/index.php有一堆应该是绝对路径的内部链接,但没有前导斜杠。用urlparse.urljoin结果解析它们时如下:

这会导致网络爬虫没有意识到它已经访问了一个页面,并且可能存在无限循环。Firefox 和 Chrome 能够发现问题并正确解决

有没有办法在 Python 中做同样的事情?请注意,假设始终使用前导斜杠是行不通的,因为我们可能正在处理真正的相对路径。

0 投票
1 回答
934 浏览

python - Python 无法获取 url 参数

我想获取用户提交表单时发送回服务器的 url 的参数。但是我收到此错误AttributeError: 'HTTPServerRequest' object has no attribute 'get'

我的网址是http://127.0.0.1:8000/reset?key=0OeKkQcSRXiy6yAvtgd9GGv4DhO1t0EYuybjHG5Buzo=

url 字符串创建为:

emailLink用作链接。

我试图key在上面的 url 中检索参数的值:

我收到其他表单数据很好,使用self.get_argument(),如果我尝试在这里使用它,那么它说'key'缺少参数。

我看到了使用的示例,urlparse但是在提交表单时如何使用它来获取 url 的参数。

0 投票
1 回答
1113 浏览

python - 从保存的 html 文件中解析的 url 链接列表中解析标记的 url 链接。并将其全部保存在 csv 输出中

如何从第 1 部分顺利过渡到第 2 部分并将结果保存在第 3 部分中?到目前为止,我无法解析抓取的 url 链接,除非我自己将它插入到第 2 部分中。此外,我无法保存输出结果,因为最后一个 url 链接覆盖了所有其他链接。

第1部分:

第2部分:

第 3 部分

更新 1.根据建议,我仍然得到这个: Traceback(最近一次调用最后一次):文件“page.py”,第 31 行,在主页 = urllib.urlopen(url) 文件“/System/Library/Frameworks/Python. framework/Versions/2.7/lib/python2.7/urllib.py”,第 87 行,在 urlopen 返回 opener.open(url) 文件“/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2. 7/urllib.py”,第 180 行,在 open fullurl = unwrap(toBytes(fullurl)) 文件“/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib.py”中,行1057,在 unwrap url = url.strip() AttributeError: 'ParseResult' object has no attribute 'strip'

0 投票
1 回答
471 浏览

python - 解析html文件后将元组转换为字符串

我需要将解析结果保存在文本文件中。

但是,我得到了这个: Traceback(最近一次调用最后一次):文件“c.py”,第 26 行,在 outfile.write(item + "\n") TypeError: can only concatenate tuple (not "str") to tuple .

如何将元组转换为字符串并将其保存在文本文件中?谢谢。

0 投票
2 回答
1889 浏览

python - 无法使用 python urlparse 解析 Url

我正在尝试编写一个小脚本,它将 url 作为输入并解析它。

以下是我的脚本

但是当我执行这个脚本时./myscript http://www.example.com

它显示以下错误。

我是新手python/scripting,我在哪里做错了?

编辑:我使用的 Python 版本是Python 2.7.5

0 投票
1 回答
396 浏览

python - 在 python 中使用 urljoin 连接 url

我正在尝试进行一些网络抓取,但在加入相对 URL 和根 URL 时遇到了一些问题

例如根 url 是:http://www.jmlr.org/proceedings/papers/v2

相对网址是:../v2/meila07a/meila07a.pdf

当我在 urlparse 中使用 urljoin: 结果很奇怪:

http://www.jmlr.org/proceedings/v2/meila07a/meila07a.pdf

这不是一个有效的链接。有人可以帮我吗?