这是我遇到问题的特定查询。我正在使用 Lift-mongo- 记录,以便我可以使用 Rogue。我很高兴使用 Rogue 特定的语法,或者任何可行的方法。
虽然下面提到了通过 java 使用 javascript 字符串的好例子,但我想知道最佳实践可能是什么。
想象这里有一张像
comments {
_id
topic
title
text
created
}
例如,所需的输出是主题列表及其计数
- 猫 (24)
- 狗 (12)
- 老鼠 (5)
所以用户可以看到一个不同/组的列表,按计数排序
这是一些伪SQL:
SELECT [DISTINCT] topic, count(topic) as topic_count
FROM comments
GROUP BY topic
ORDER BY topic_count DESC
LIMIT 10
OFFSET 10
一种方法是使用一些 DBObject DSL,例如
val cursor = coll.group( MongoDBObject(
"key" -> MongoDBObject( "topic" -> true ) ,
//
"initial" -> MongoDBObject( "count" -> 0 ) ,
"reduce" -> "function( obj , prev) { prev.count += obj.c; }"
"out" -> "topic_list_result"
))
[...].sort( MongoDBObject( "created" ->
-1 )).skip( offset ).limit( limit );
上述变体无法编译。
我可以问“我做错了什么”,但我想我可以让我的困惑更加严重:
- 我可以直接链接结果还是需要“输出”?
- 我可以期待什么样的输出 - 我的意思是,我是迭代游标还是“out”参数
- 是否需要“条件”?
- 我应该使用 count() 还是 distinct()
- 一些示例包含“地图”参数...
我最近发现一篇涵盖 java 驱动程序的帖子暗示我应该使用字符串而不是 DSL: http ://blog.evilmonkeylabs.com/2011/02/28/MongoDB-1_8-MR-Java/
这会是 casbah 还是 Rogue 的首选方法?
更新:9/23
这在 Scala/Casbah 中失败(编译但产生错误 {MapReduceError 'None'} )
val map = "function (){ emit({ this.topic }, { count: 1 }); }"
val reduce = "function(key, values) { var count = 0; values.forEach(function(v) { count += v['count']; }); return {count: count}; }"
val out = coll.mapReduce( map , reduce , MapReduceInlineOutput )
ConfiggyObject.log.debug( out.toString() )
在看到https://github.com/mongodb/casbah/blob/master/casbah-core/src/test/scala/MapReduceSpec.scala后,我确定了上述内容
猜测:
- 我误解了 toString 方法和 out.object 是什么?
- 缺少敲定?
- 缺少输出规范?
- https://jira.mongodb.org/browse/SCALA-43?
这可以从命令行按需要工作:
map = function (){
emit({ this.topic }, { count: 1 });
}
reduce = function(key, values) { var count = 0; values.forEach(function(v) { count += v['count']; }); return {count: count}; };
db.tweets.mapReduce( map, reduce, { out: "results" } ); //
db.results.ensureIndex( {count : 1});
db.results.find().sort( {count : 1});
更新 该问题尚未在 Mongo 中作为错误提交。 https://jira.mongodb.org/browse/SCALA-55