我正在使用 python 并尝试获取 url 的特定部分,如下所示
from urlparse import urlparse as ue
url = "https://www.google.co.in"
img_url = ue(url).hostname
结果
www.google.co.in
案例1:
实际上我会有一些 url(存储在列表或其他地方),所以我想要的是,需要domain name在 url 中找到上面的内容并获取之后www.和之前的部分.co.in,即字符串在之后first dot和之前开始second dot这只会google导致目前的情况。
因此,假设给出的 url 是 url given is www.gmail.com,我应该只gmail在其中获取,所以无论给出的 url 是什么,代码都应该获取以第一个点开头和第二个点之前的部分。
案例2:
也可以像这样直接给出一些 url ,domain.com, stackoverflow.com而不www在 url 中,在这种情况下,它应该只获取stackoverflowand domain。
最后,我的意图是从这样的 url 中获取主名称gmail, stackoverflow, google.....
一般来说,如果我有一个 url,我可以使用list slicing并获取字符串,但我会有许多 ulr,所以需要像上面提到的那样动态获取想要的部分
谁能让我知道如何满足上述概念?