1

新浪微博是一个中文微博网站,我正在做一个抓取项目,涉及获取该网站每个用户的博客帖子数,

网址: http: //blogus.sina.com/gb/hotbloger/#top

在这个页面中你们可以看到所有用户的列表,点击每个用户,我们将被重定向到相应的博客页面,我想获取每个用户的帖子计数(通过检查日期和时间)。

他们正在提供 api 来获取详细信息 API: http: //open.weibo.com/wiki/API%E6%96%87%E6%A1%A3/en

但我没有找到任何 api 调用来获取这些指定的详细信息。有没有其他方法可以获取详细信息?或者我们可以直接抓取网站吗?请帮忙。

4

1 回答 1

0

您可以通过 API 方法获取有关用户的信息2/users/show

例如,您提到的页面中的第一个链接是:

http://redirect.sina.com/blogus/u/blog.sina.com.cn/u/1763875377

这是对用户 id 1763875377 页面的重定向。因此,您可以简单地调用https://api.weibo.com/2/users/show.json?uid=1763875377,除其他外,它将返回该用户的帖子数 ( "statuses_count":1583)。

您还可以使用/2/users/counts端点一次获取多个用户的帖子数。

执行这些经过身份验证的调用需要访问令牌(基本上,您需要在微博上注册一个应用程序)。

于 2014-06-12T14:04:43.167 回答