我创建了一个简单的 erlang 应用程序,它定期收集所需的数据并将其放入 riak 数据库中。
当我启动我的应用程序时,它运行顺利.. 但是一段时间后它卡住了,因为对 riak 数据库的 PUT 请求变得太慢了.. 它是来自我的应用程序的日志:
2013-06-26 12:44:09.090 [info] <0.60.0> data processed in [16476 ms]
2013-06-26 12:45:51.472 [info] <0.60.0> data processed in [18793 ms]
...
2013-06-26 12:57:28.138 [info] <0.60.0> data processed in [15135 ms]
2013-06-26 13:07:01.484 [info] <0.60.0> data processed in [488420 ms]
2013-06-26 14:03:11.561 [info] <0.60.0> data processed in [3370075 ms]
在 riak 崩溃日志中,我可以看到很多消息,例如
2013-06-26 17:06:20 =CRASH REPORT====
crasher:
initial call: riak_kv_index_hashtree:init/1
pid: <0.13660.7>
registered_name: []
exception exit: {{{badmatch,{error,{db_open,"IO error: ./data/anti_entropy/
433883298582611803841718934712646521460354973696/MANIFEST-000004:
Cannot allocate memory"}}}, [{hashtree,new_segment_store,2,
[{file,"src/hashtree.erl"},{line,499}]},
{hashtree,new,2,[{file,"src/hashtree.erl"},{line,215}]},
{riak_kv_index_hashtree,do_new_tree,2,
[{file,"src/riak_kv_index_hashtree.erl"},
{line,426}]},{lists,foldl,3,[{file,"lists.erl"},
{line,1197}]},{riak_kv_index_hashtree,
init_trees,2,[{file,"src/riak_kv_index_hashtree.erl"},
{line,368}]},{riak_kv_index_hashtree,init,1,
[{file,"src/riak_kv_index_hashtree.erl"},
{line,225}]},{gen_server,init_it,6,[{file,"gen_server.erl"},{line,304}]},
{proc_lib,init_p_do_apply,3,[{file,"proc_lib.erl"},{line,227}]}]},
[{gen_server,init_it,6,[{file,"gen_server.erl"},{line,328}]},
{proc_lib,init_p_do_apply,3,[{file,"proc_lib.erl"},{line,227}]}]}
ancestors: [<0.955.0>,riak_core_vnode_sup,riak_core_sup,<0.129.0>]
messages: []
links: []
dictionary: []
trap_exit: false
status: running
heap_size: 1597
stack_size: 24
reductions: 593
neighbours:
我可以在 Amazon AWS 和本地虚拟机上看到相同的行为。我的虚拟机很小,只有 512-1024 mb。AWS 是 Micro,所以它有相同的内存量。
目前没有集群。只是带有 Riak 和我的应用程序在其上运行的单个节点。
我检查了 riak 文档,他们建议做的基本事情是增加 ulimit 并更新 sysctl。因此,我的服务器 ulimit 显示: ulimit -n 65536 AND sysctl 按照建议更新。
我试过bitcask和eleveldb,但结果是一样的。
目前,我无法弄清楚发生了什么问题以及为什么 riak 无法分配内存.. 谢谢。