需要一种使用 Python urlparse 从 url 中提取没有子域的域名的方法。
例如,我想"google.com"
从完整的 url中提取"http://www.google.com"
.
我能想到的最接近的urlparse
是netloc
属性,但它包括子域,在本例中为www.google.com
.
我知道可以编写一些自定义字符串操作来将 www.google.com 转换为 google.com,但我想避免在此任务中手动进行字符串转换或正则表达式。(这样做的原因是我对 url 形成规则不够熟悉,因此我确信我可以考虑编写自定义解析函数所需的每个边缘情况。)
或者,如果urlparse
不能做我需要的,有没有人知道任何其他 Python url 解析库?