9

我正在努力使用 mongodb 中的一些聚合函数。

假设我有一些这样的文件

 [
 {
    _id: "1",
    periods: [
      {
         _id: "12",
         tables: [
           {
              _id: "121",
              rows: [
                  { _id: "1211", text: "some text"},
                  { _id: "1212", text: "some other text"},
                  { _id: "1213", text: "yet another text"},

              ]
           }
         ]
      },
      {
         _id: "13",
         tables: [
           {
              _id: "131",
              rows: [
                  { _id: "1311", text: "different text"},
                  { _id: "1312", text: "Oh yeah"}                      
              ]
           }
         ]
      }
    ]
 },
 {
    _id: "2",
    periods: [
      {
         _id: "21",
         tables: [
           {
              _id: "212",
              rows: [
                  { _id: "2121", text: "period2 text"},
                  { _id: "2122", text: "period2 other text"},
                  { _id: "2123", text: "period2 yet another text"},

              ]
           }
         ]
      }
    ]
 }
 ]

现在我想使用 mongodb 查询来检索一个特定顶级项目的所有唯一文本。

例如,聚合顶部_id 1 的所有文本。这意味着我想获取两个周期子树中的所有文本。

预期输出如下:

_id 上的聚合文本过滤:1

[
   "some text",
   "some other text",
   "yet another text",
   "different text",
   "Oh yeah"
]

_id 上的聚合文本过滤:2

[
  "period2 some text",
  "period2 some other text",
  "period2 yet another text"
]

到目前为止,我已经设法聚合了所有文本,但最终出现在多个数组中,并且我没有设法使用 $match 在 id 上过滤它们,

我当前的聚合查询看起来像这样

[ 
    { "$project" : { "text" : "$periods.tables.rows.text" , "_id" : "$_id"}},
    { "$unwind" : "$text"},
    { "$group" : { "_id" : "$_id" , "texts" : { "$addToSet" : "$text"}}},
    { "$project" : { "_id" : 0 , "texts" : 1}} 
]

它给了我一个看起来像这样的结果

{ "texts" : [ 
        [ [ "Some text" , "Some other text" , "yet another text"] , [ "different text" , "oh yeah" ] ],
        [ [ "period2 some text", "period2 some other text", "period2 yet another text"]]
    ]}

如果我添加 $match: {_id: 1},则不会返回任何结果。

谁能帮我解决这个问题,或者指出如何解决它的方向。我一直在寻找资源,但似乎没有找到任何关于如何使用这些聚合函数的好文档。mongodb 文档只使用简单的文档。

PS 我知道我可以使用 mapreduce 来做到这一点,但希望能够为此使用聚合函数。

4

1 回答 1

18

放松只会下降一级,所以如果你喜欢,你必须调用你所拥有的级别的多次

[ 
    { "$project" : { "text" : "$periods.tables.rows.text" , "_id" : "$_id"}},
    { "$unwind" : "$text"},
    { "$unwind" : "$text"},
    { "$unwind" : "$text"},
    { "$group" : { "_id" : "$_id" , "texts" : { "$addToSet" : "$text"}}},
    { "$project" : { "_id" : 0 , "texts" : 1}} 
]

它将按您的预期工作。

于 2013-09-13T14:32:36.260 回答