向 twitter api 发出 get 请求时,它会返回数组中的所有推文tweets.statuses
。我们可以使用 找到总推文计数tweets.statuses.length
。在一个请求中,即使有 1000 条可用推文,它也最多只能返回 100 条推文。
类似地,元数据在数组tweets.search_metadata
中返回,如下所示。这里的 count 是传递给 twitter api 的计数,而不是返回的推文计数。
{ completed_in: 0.13,
max_id: 1049894626625286100,
max_id_str: '1049894626625286144',
next_results: '? max_id=1049894470475485183&q=apple&count=100&include_entities=1',
query: 'apple',
refresh_url: '?since_id=1049894626625286144&q=apple&include_entities=1',
count: 100,
since_id: 0,
since_id_str: '0' }
在上面的元数据中,我们可以检查是否next_results
存在。如果是这样,这意味着有更多可用的结果,所以我们可以一次又一次地向 twitter api 发出请求,每次都向它传递一个新的 max_id,直到 next_results 为空,即返回最后一批结果时它不存在. 每次 next_results 存在时,都会生成一个新的 max_id,可用于获取接下来的 100 条推文。
为了解决这个问题,我使用了一个 do while 循环,其中代码块(即 twitter api 请求)将在检查条件(即是否next_results
存在)之前至少运行一次。
问题是我的 do while 循环只运行一次,即使next_results
它仍然可用且不为空。我究竟做错了什么!
我的 node.js 代码如下所示:
require('dotenv').load();
var Twitter = require('twitter');
var client = new Twitter({
consumer_key: process.env.TWITTER_CONSUMER_KEY,
consumer_secret: process.env.TWITTER_CONSUMER_SECRET,
bearer_token: process.env.TWITTER_BEARER_TOKEN
});
var url = 'apple';
var totalCount = 0;
var resultsExist, maxid, isEqualsToLocation, andLocation;
do {
client.get('search/tweets', {q: url, count:100, max_id: maxid})
.then(function(tweets){
console.log('next_results: ',tweets.search_metadata.next_results)
console.log('totalCount: ',tweets.statuses.length)
console.log(tweets.search_metadata)
totalCount += tweets.statuses.length
console.log(totalCount)
console.log(tweets.search_metadata.next_results == null)
if(tweets.search_metadata.next_results != null){
resultsExist = tweets.search_metadata.next_results
console.log('result is', resultsExist)
isEqualsToLocation = resultsExist.indexOf('=');
andLocation = resultsExist.indexOf('&');
maxid = resultsExist.substring(isEqualsToLocation+1,andLocation);
console.log(maxid)
} else {
resultsExist = tweets.search_metadata.next_results
}
console.log(resultsExist == null)
})
}
while (resultsExist != null);