我是 javascript 和 node.js 的新手,这是我的第一篇文章,所以请多多包涵。
我正在使用 ntwitter 来获取特定用户以前的所有推文。
我的问题是,如果用户有超过 200 条推文,我需要创建一个循环,我不确定我是否做得对。
这是获取 200 条最新推文的异步函数:
exports.getUserTimeline = function(user, callback) {
twit.getUserTimeline({ screen_name: user, count: 200 }, function(err, data) {
if (err) {
return callback(err);
}
callback(err, data);
});
}
我找到了一个使用递归函数的解决方案,但它非常难看。我该如何改进它?
exports.getUserHistory = function(user, callback) {
recursiveSearch(user, callback);
function recursiveSearch(user, callback, lastId, data) {
var data = data || []
, args = {screen_name: user, count: 200};
if(typeof lastId != "undefined") args.max_id = lastId;
twit.getUserTimeline(args, function(err, subdata) {
if (err) {
console.log('Twitter search failed!');
return callback(err);
}
if (data.length !== 0) subdata.shift();
data = data.concat(subdata);
var lastId = parseInt(data[data.length-1].id_str);
if (subdata.length !== 0) {
recursiveSearch(user, callback, lastId, data);
} else {
callback(err, data);
}
});
}
}
非常感谢!
更新:这是 Hunterloftis 建议的改进(重构)功能,有两个修改:
- 不应在第一次迭代时指定属性 max_id
- 必须处理用户存在但未发推文的情况
代码:
function getUserHistory(user, done) {
var data = [];
search();
function search(lastId) {
var args = {
screen_name: user,
count: 200,
include_rts: 1
};
if(lastId) args.max_id = lastId;
twit.getUserTimeline(args, onTimeline);
function onTimeline(err, chunk) {
if (err) {
console.log('Twitter search failed!');
return done(err);
}
if (!chunk.length) {
console.log('User has not tweeted yet');
return done(err);
}
//Get rid of the first element of each iteration (not the first time)
if (data.length) chunk.shift();
data = data.concat(chunk);
var thisId = parseInt(data[data.length - 1].id_str);
if (chunk.length) return search(thisId);
console.log(data.length + ' tweets imported');
return done(undefined, data);
}
}
}
在检索推文时,我注意到我的推文计数并不总是与用户的“statuses_count”属性相同。我花了一些时间才弄清楚这种差异对应于已删除推文的数量:)