问题标签 [urlparse]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
spring - 重用 Spring RequestMapping 解析功能
我有一些属性,例如 /my/{custom}/url
我需要在运行时用一些值替换 {custom}
我知道 Spring 正在使用具有类似语法的“@RequestMapping”来进行@PathAttribute 匹配。
我想知道是否有一些我可以从 Spring 中重用的类来实现我所需要的。
python - 如何使用 `urlparse` 检查 URL 是否有效?
在打开 URL 以读取数据之前,我想检查 URL 是否有效。
我正在使用包中的urlparse
功能urlparse
:
但是,我注意到一些有效的 URL 被视为损坏,例如:
此 URL 有效(我可以使用浏览器打开它)。
有没有更好的方法来检查 URL 是否有效?
python - 使用 urlparse 删除某个字符串?
我有这个网址:
我想把它转换成
请注意我使用的是 python 2.7。
返回www.domain.com/a/b/c/d,authorised=false.html
,但我不知道如何authorised=false
从 URL 中删除部分
python - 如何在 urlparse 中用新值替换查询?
所以我有一个数据如下:
使用 urlparse 模块。如何用新大小替换上述数据,使其看起来像这样:
python - 绝对路径没有前导斜杠时的 urljoin
一些网站,如http://www.gilacountyaz.gov/government/assessor/index.php有一堆应该是绝对路径的内部链接,但没有前导斜杠。用urlparse.urljoin
结果解析它们时如下:
这会导致网络爬虫没有意识到它已经访问了一个页面,并且可能存在无限循环。Firefox 和 Chrome 能够发现问题并正确解决
有没有办法在 Python 中做同样的事情?请注意,假设始终使用前导斜杠是行不通的,因为我们可能正在处理真正的相对路径。
python - Python 无法获取 url 参数
我想获取用户提交表单时发送回服务器的 url 的参数。但是我收到此错误AttributeError: 'HTTPServerRequest' object has no attribute 'get'
我的网址是http://127.0.0.1:8000/reset?key=0OeKkQcSRXiy6yAvtgd9GGv4DhO1t0EYuybjHG5Buzo=
url 字符串创建为:
emailLink
用作链接。
我试图key
在上面的 url 中检索参数的值:
我收到其他表单数据很好,使用self.get_argument()
,如果我尝试在这里使用它,那么它说'key'缺少参数。
我看到了使用的示例,urlparse
但是在提交表单时如何使用它来获取 url 的参数。
python - 从保存的 html 文件中解析的 url 链接列表中解析标记的 url 链接。并将其全部保存在 csv 输出中
如何从第 1 部分顺利过渡到第 2 部分并将结果保存在第 3 部分中?到目前为止,我无法解析抓取的 url 链接,除非我自己将它插入到第 2 部分中。此外,我无法保存输出结果,因为最后一个 url 链接覆盖了所有其他链接。
第1部分:
第2部分:
第 3 部分
更新 1.根据建议,我仍然得到这个: Traceback(最近一次调用最后一次):文件“page.py”,第 31 行,在主页 = urllib.urlopen(url) 文件“/System/Library/Frameworks/Python. framework/Versions/2.7/lib/python2.7/urllib.py”,第 87 行,在 urlopen 返回 opener.open(url) 文件“/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2. 7/urllib.py”,第 180 行,在 open fullurl = unwrap(toBytes(fullurl)) 文件“/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib.py”中,行1057,在 unwrap url = url.strip() AttributeError: 'ParseResult' object has no attribute 'strip'
python - 解析html文件后将元组转换为字符串
我需要将解析结果保存在文本文件中。
但是,我得到了这个: Traceback(最近一次调用最后一次):文件“c.py”,第 26 行,在 outfile.write(item + "\n") TypeError: can only concatenate tuple (not "str") to tuple .
如何将元组转换为字符串并将其保存在文本文件中?谢谢。
python - 无法使用 python urlparse 解析 Url
我正在尝试编写一个小脚本,它将 url 作为输入并解析它。
以下是我的脚本
但是当我执行这个脚本时./myscript http://www.example.com
它显示以下错误。
我是新手python/scripting
,我在哪里做错了?
编辑:我使用的 Python 版本是Python 2.7.5
python - 在 python 中使用 urljoin 连接 url
我正在尝试进行一些网络抓取,但在加入相对 URL 和根 URL 时遇到了一些问题
例如根 url 是:http://www.jmlr.org/proceedings/papers/v2
相对网址是:../v2/meila07a/meila07a.pdf
当我在 urlparse 中使用 urljoin: 结果很奇怪:
http://www.jmlr.org/proceedings/v2/meila07a/meila07a.pdf
这不是一个有效的链接。有人可以帮我吗?