这是维基百科文章标题最新列表的链接:
https://dumps.wikimedia.org/enwiki/latest/enwiki-latest-all-titles-in-ns0.gz
但该列表按文章标题排序(从 0-9、AZ、...)。现在我想要按浏览量排名排序的列表。我怎样才能做到这一点?
这是维基百科文章标题最新列表的链接:
https://dumps.wikimedia.org/enwiki/latest/enwiki-latest-all-titles-in-ns0.gz
但该列表按文章标题排序(从 0-9、AZ、...)。现在我想要按浏览量排名排序的列表。我怎样才能做到这一点?
获取页面浏览转储,将它们加载到数据库中,处理它们(它们按小时划分并包括所有 Wikimedia 项目,因此您可能需要过滤和聚合),然后将其用于排序。