我正在使用 python 并尝试获取 url 的特定部分,如下所示
from urlparse import urlparse as ue
url = "https://www.google.co.in"
img_url = ue(url).hostname
结果
www.google.co.in
案例1:
实际上我会有一些 url(存储在列表或其他地方),所以我想要的是,需要domain name
在 url 中找到上面的内容并获取之后www.
和之前的部分.co.in
,即字符串在之后first dot
和之前开始second dot
这只会google
导致目前的情况。
因此,假设给出的 url 是 url given is www.gmail.com
,我应该只gmail
在其中获取,所以无论给出的 url 是什么,代码都应该获取以第一个点开头和第二个点之前的部分。
案例2:
也可以像这样直接给出一些 url ,domain.com, stackoverflow.com
而不www
在 url 中,在这种情况下,它应该只获取stackoverflow
and domain
。
最后,我的意图是从这样的 url 中获取主名称gmail, stackoverflow, google
.....
一般来说,如果我有一个 url,我可以使用list slicing
并获取字符串,但我会有许多 ulr,所以需要像上面提到的那样动态获取想要的部分
谁能让我知道如何满足上述概念?