给定一个 URL,我如何使用公共后缀列表(有效 TLD 列表,例如此列表)提取注册域?
例如,考虑a.bg是一个有效的公共后缀:
http://www.test.start.a.bg/hello.html -> start.a.bg
http://test.start.a.bg/ -> start.a.bg
http://test.start.abc.bg/ -> abc.bg (.bg is the public suffix)
这不能使用简单的字符串操作来完成,因为公共后缀可以由多个级别组成,具体取决于 TLD。
PS我如何读取列表(数据库或平面文件)并不重要,但列表应该可以在本地访问,所以我并不总是依赖外部服务。