1

我正在为一个班级做一个数据挖掘项目,我们项目的一部分涉及从 Tumblr 获取大量随机帖子。不幸的是,Tumblr API(特别是使用 PyTumblr)似乎没有直接的能力来做到这一点,因为它需要特定的博客名称或标签。有什么合理的方法可以做到这一点吗?我最好的想法是从 Trending 上的帖子中获取博客名称和/或标签,但我不确定这是否足以满足我们的目的。我们最终想要一个数据集,该数据集可以划分为使用指定集合中的一个或多个标签标记的帖子,以及不包含这些标签的帖子。

4

0 回答 0