堆垛机
我在 RabbitMQ 队列中有很多消息(在我的开发环境中的本地主机上运行)。消息的有效负载是一个 JSON 字符串,我想直接加载到 Elastic Search 中(目前也在 localhost 上运行)。我写了一个快速的 ruby 脚本来从队列中提取消息并将它们加载到 ES 中,如下所示:
#! /usr/bin/ruby
require 'bunny'
require 'json'
require 'elasticsearch'
# Connect to RabbitMQ to collect data
mq_conn = Bunny.new
mq_conn.start
mq_ch = mq_conn.create_channel
mq_q = mq_ch.queue("test.data")
# Connect to ElasticSearch to post the data
es = Elasticsearch::Client.new log: true
# Main loop - collect the message and stuff it into the db.
mq_q.subscribe do |delivery_info, metadata, payload|
begin
es.index index: "indexname",
type: "relationship",
body: payload
rescue
puts "Received #{payload} - #{delivery_info} - #{metadata}"
puts "Exception raised"
exit
end
end
mq_conn.close
队列中大约有 4,000,000 条消息。
当我运行脚本时,我看到一堆消息,比如 30 条消息,正在加载到 Elastic Search 中。但是,我看到大约 500 条消息离开队列。
root@beep:~# rabbitmqctl list_queues
Listing queues ...
test.data 4333080
...done.
root@beep:~# rabbitmqctl list_queues
Listing queues ...
test.data 4332580
...done.
然后脚本静默退出,不告诉我异常。开始/救援块永远不会触发异常,所以我不知道为什么脚本会提前完成或丢失这么多消息。接下来我应该如何调试的任何线索。
一个