我正在编写一个小程序,将 Twitter 公共流中的推文放入 HBase 数据库。该程序使用两个线程,一个用于收集推文,一个用于处理它们。第一个线程使用 twitter4j StatusListener 获取推文并将它们放入容量为 100 的 ArrayBlockingQueue 中。第二个线程从队列中获取状态,过滤所需的数据并将它们移动到数据库中。处理比收集状态需要更多时间。
生产者看起来像这样:
public void onStatus(Status status) {
try {
this.queue.put(status);
} catch(Exception ex) {
ex.printStackTrace();
}
}
消费者使用 take 并调用一个函数来处理新的状态:
public void run() {
try {
while(true) {
// Get new status to process
this.status = this.queue.take();
this.analyse();
}
} catch(Exception ex) {
ex.printStackTrace();
}
}
在 main 函数中创建并启动了两个线程:
ArrayBlockingQueue<Status> queue_public = new ArrayBlockingQueue<Status>(100);
Thread ta_public = new Thread(new TweetAnalyser(cl.getOptionValue("config"), queue_public));
Thread st_public = new Thread(new RunPublicStream(cl.getOptionValue("config"), queue_public));
ta_public.start();
st_public.start();
该程序运行了一段时间没有任何问题,但随后突然停止。此时队列已满,消费者似乎无法从中获取新状态。我尝试了几种生产者/消费者模式的变体,但均未成功。不会抛出异常。
我不知道要寻找失败。我希望有人能给我一个提示或解决方案。