2

我想在 erlang 中执行一个 mapreduce 查询,它包含两个映射阶段,以便 Map2 函数将 Map1 函数的结果作为输入。是否有可能,如果,每个地图阶段的返回值必须是什么

  • 更多细节:

我使用两个简单的 map 函数运行了一个测试 mapred 查询,每个函数都返回输入对象(在列表中)。但是通过运行查询,我得到一个错误匹配错误

Map1 = fun(O,_,_) -> [O] end.
Map2 = fun(O, _,_) -> [O] end.


C:mapred_bucket(<<"b7bc1418-198d-44a3-8835-8aa9cb416d5b">>, [{map, {qfun, Map1}, none, false}, {map, {qfun, Map2}, none, true}]).

{{badmatch,{r_object,<<"b7bc1418-198d-44a3-8835-8aa9cb416d5b">>,
                     <<255,230,193,167,254,7,246,64,154,190,36,236,32,232,189,
                       169,161,124,23,86>>,
                     [{r_content,{dict,2,16,16,8,80,48,
                                       {[],[],[],[],[],[],[],[],[],[],[],...},
                                       {{[],[],[],[],[],[],[],[],[],...}}},
                                 <<"12d33872-4c92-4da5-9d16-5036a8059253">>}],
                     [{<<5,215,86,61>>,{1,63487018636}}],
                     {dict,1,16,16,8,80,48,
                           {[],[],[],[],[],[],[],[],[],[],[],[],...},
                           {{[],[],[],[],[],[],[],[],[],[],...}}},
                     undefined}},
 [{riak_kv_map_phase,build_input,2},
  {riak_kv_map_phase,'-handle_input/3-lc$^0/1-0-',2},
  {riak_kv_map_phase,handle_input,3},
  {luke_phase,executing,2},
  {gen_fsm,handle_msg,7},
  {proc_lib,init_p_do_apply,3}]}

我正在使用 riak_search-0.14.2

二郎 R14B03 (erts-5.8.4)

谢谢你!

4

2 回答 2

5

我不确定 Erlang 中 Map 方法的签名是什么,因为我只在 Javascript 中完成了 map/reduce,但我会尽力提供帮助。

为了链接映射阶段,只有最后一个映射函数需要返回 Riak 中的对象列表。它上面的每个其他映射函数都需要返回一个元组,其中包含存储桶名称和传入值的键。

在 Javascript 中,我是这样完成的:

function map_function(value, keydata, arg) {
    //filtering stuff here
    if(arg.last) {
      data["key"] = value.key;
      return [data];
    }
    else {
      return [[value.bucket, value.key]];
    }
    //this is in the case the filter returns true; if the filter returns false, return an empty tuple
  }

希望这可以帮助。

于 2012-01-11T01:31:05.880 回答
4

您必须从第一个 map 函数返回 {Bucket, Key} 或 {{Bucket, Key}, KeyData}。
像这样:

Map1 = fun(O,_,_) -> [{riak_object:bucket(O), riak_object:key(O)}] end.
Map2 = fun(O, _,_) -> [O] end.


C:mapred_bucket(<<"b7bc1418-198d-44a3-8835-8aa9cb416d5b">>, [{map, {qfun, Map1}, none, false}, {map, {qfun, Map2}, none, true}]).
于 2012-06-04T15:27:16.167 回答