python - Facebook 页面详细信息和 RESTful API？

Question

嗨，我有一个 Facebook 页面 url 列表

eg...
http://www.facebook.com/daftpunk
http://www.facebook.com/DavidGuetta
...

最好的方法是：

帮助将不胜感激。

score 3 · Accepted Answer

不抓取任何内容（这违反了 Facebook 的服务条款）：

有关可以在同一调用中检索的其他数据，请参阅页面 FQL 表。

score 2 · Accepted Answer

使用urllib2或pyfacebook获取内容

使用BeautifulSoup或lxml解析它

使用re模块（正则表达式）提取内容以进行验证和数据收集

score 1 · Accepted Answer

粉丝数位于“FanManager”类的标签中。您可以使用 Beautiful Soup 来获取这个标签的内容，并使用正则表达式从字符串中获取数据（例如：1,000,000 个粉丝）作为 int 或任何您想要的。

要查看该页面是否存在，请检查一些标签以查看您是否在 404 页面上。

score 0 · Accepted Answer

0

您可以使用scrapy或BeautifulSoup来抓取内容。

于 2010-01-20T21:27:16.130 回答

4 回答 4