我有 2 个数据集,一个是另一个的补充。它看起来像这样(不是实际字段):
Question
========
id(key)
name
description
Answer
========
id(key)
type
question_id
Output
======
question_id (key)
name
description
type_a_count
type_b_count
我想知道每个问题有多少特定类型的答案。我曾经使用 mongodb 的 map reduce 引擎来执行此操作,方法是发出我的问题映射器的相同字段(但归零),除了 type_count 字段中的一个,然后将所有内容添加到我的 reducer 中。我现在遇到的问题是,当我运行答案映射器时,我的问题映射器中的值被答案映射器中的值覆盖。
我正在寻找相当于 mongodb 的 {out: "reduce"} 选项。
更多细节:
- 我只为我的问题映射器使用映射器
- 两个作业的 outputURI 是相同的,因为我希望它合并
- 我想使用问题映射器的输出和答案映射器的输出作为我的减速器的输入