我正在运行一个 URL 分类器算法。我几乎没有与博客相关的 URL,我想知道输入的 URL 是用于任何博客文章还是博客的 URL。
示例 1 - 如果我们输入以下 URL
http://gizmodo.com/
它会告诉上面的 URL 是主页
示例 2 - 如果我们输入以下 URL
http://gizmodo.com/everyone-can-get-the-new-google-maps-right-now-805487210
它会告诉上面的 URL 是 blogpost。
无论如何我可以在Python中做到这一点吗?有没有我可能遗漏的算法?或者任何开源包或服务?