我一直在用标签 mooc(大规模在线开放课程)抓取推文。我现在想识别发送推文的用户以及每个用户的推文数量
这就是我识别用户的方式:
for page in range(1,16):
url='http://search.twitter.com/search.json?q=mooc&rpp=100'+str(page)
file=urllib.urlopen(url)
search = json.load(file)
for entry in search['results']:
pprint.pprint(entry['from_user'])
这适用于打印数据,但现在我正在努力存储这些数据,而不是打印它,以便计算每个用户的推文。
import collections
y=collections.Counter(users)
print y
也欢迎任何其他关于如何计算用户推文的想法!