鉴于这种 :
URL u=new URL("someURL");
我如何识别 URL 的顶级域..
Guava为此提供了一个很好的实用程序。它的工作原理如下:
InternetDomainName.from("someurl.co.uk").publicSuffix()
会得到你co.uk
InternetDomainName.from("someurl.de").publicSuffix()
会得到你de
所以你只想拥有顶级域部分?
//parameter urlString: a String
//returns: a String representing the TLD of urlString, or null iff urlString is malformed
private String getTldString(String urlString) {
URL url = null;
String tldString = null;
try {
url = new URL(urlString);
String[] domainNameParts = url.getHost().split("\\.");
tldString = domainNameParts[domainNameParts.length-1];
}
catch (MalformedURLException e) {
}
return tldString;
}
让我们测试一下!
@Test
public void identifyLocale() {
String ukString = "http://www.amazon.co.uk/Harry-Potter-Sheet-Complete-Series/dp/0739086731";
logger.debug("ukString TLD: {}", getTldString(ukString));
String deString = "http://www.amazon.de/The-Essential-George-Gershwin/dp/B00008GEOT";
logger.debug("deString TLD: {}", getTldString(deString));
String ceShiString = "http://例子.测试";
logger.debug("ceShiString TLD: {}", getTldString(ceShiString));
String dokimeString = "http://παράδειγμα.δοκιμή";
logger.debug("dokimeString TLD: {}", getTldString(dokimeString));
String nullString = null;
logger.debug("nullString TLD: {}", getTldString(nullString));
String lolString = "lol, this is a malformed URL, amirite?!";
logger.debug("lolString TLD: {}", getTldString(lolString));
}
输出:
ukString TLD: uk
deString TLD: de
ceShiString TLD: 测试
dokimeString TLD: δοκιμή
nullString TLD: null
lolString TLD: null
根据文档,url 的主机部分符合 RFC 2732 。这意味着只需拆分您从中获得的字符串
String host = u.getHost();
还不够。在搜索主机时,您需要确保符合 RFC 2732,或者如果您可以保证所有地址的格式为 server.com,那么您可以搜索最后一个。在字符串中并抓住 tld。
使用URL#getHost()
,如有必要,然后String#split()
打开"\\."
。
更新:如果您实际上有一个IP地址作为主机,那么您需要InetAddress#getHostName()
独立使用。