8

鉴于这种 :

URL u=new URL("someURL");

我如何识别 URL 的顶级域..

4

4 回答 4

7

Guava为此提供了一个很好的实用程序。它的工作原理如下:

InternetDomainName.from("someurl.co.uk").publicSuffix()会得到你co.uk InternetDomainName.from("someurl.de").publicSuffix()会得到你de

于 2019-08-23T10:27:48.813 回答
5

所以你只想拥有顶级域部分

//parameter urlString: a String
//returns: a String representing the TLD of urlString, or null iff urlString is malformed
private String getTldString(String urlString) {
    URL url = null;
    String tldString = null;
    try {
        url = new URL(urlString);
        String[] domainNameParts = url.getHost().split("\\.");
        tldString = domainNameParts[domainNameParts.length-1];
    }
    catch (MalformedURLException e) {   
    }

    return tldString;
}

让我们测试一下!

@Test 
public void identifyLocale() {
    String ukString = "http://www.amazon.co.uk/Harry-Potter-Sheet-Complete-Series/dp/0739086731";
    logger.debug("ukString TLD: {}", getTldString(ukString));

    String deString = "http://www.amazon.de/The-Essential-George-Gershwin/dp/B00008GEOT";
    logger.debug("deString TLD: {}", getTldString(deString));

    String ceShiString = "http://例子.测试";
    logger.debug("ceShiString TLD: {}", getTldString(ceShiString));

    String dokimeString = "http://παράδειγμα.δοκιμή";
    logger.debug("dokimeString TLD: {}", getTldString(dokimeString));

    String nullString = null;
    logger.debug("nullString TLD: {}", getTldString(nullString));

    String lolString = "lol, this is a malformed URL, amirite?!";
    logger.debug("lolString TLD: {}", getTldString(lolString));

}

输出:

ukString TLD: uk
deString TLD: de
ceShiString TLD: 测试
dokimeString TLD: δοκιμή
nullString TLD: null
lolString TLD: null
于 2013-02-02T13:42:46.820 回答
3

根据文档,url 的主机部分符合 RFC 2732 。这意味着只需拆分您从中获得的字符串

  String host = u.getHost();

还不够。在搜索主机时,您需要确保符合 RFC 2732,或者如果您可以保证所有地址的格式为 server.com,那么您可以搜索最后一个。在字符串中并抓住 tld。

于 2010-01-26T18:07:45.987 回答
1

使用URL#getHost(),如有必要,然后String#split()打开"\\."

更新:如果您实际上有一个IP地址作为主机,那么您需要InetAddress#getHostName()独立使用。

于 2010-01-26T17:27:25.883 回答