问题标签 [nosql-aggregation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
498 浏览

couchbase - Couchbase 按名称分组并收集字段值

来自 mongoDB 5 年,现在只是学习/尝试 Couchbase。我有一个测试数据,我想按城市分组,并将所有main.temp值收集/推送到一个字段。这可以通过$push或在 mongoDB 聚合中完成$addToSet

测试数据

我希望结果是这样的,如果可能的话,我想将临时数组排序为 desc/asc

我使用管理员的 gui 查询尝试了一些东西,但它没有给我想要的确切结果。

0 投票
1 回答
28 浏览

mongodb - 使用 mongodb 查看结果中的子节点数据

我正在尝试在 mongodb 中查看子节点数据

我在 mongodb 中编写的查询是 -

我只想查看名称和 facebook 字段

但它将数据显示为 -

如您所见,2 和 4 数据中的数据没有 fb 字段。

我拥有的原始数据是 -

0 投票
0 回答
155 浏览

cql - Cassandra 最大计数子字符串

需要做一些 Max Count Groupby 和 substring (like a%) 类型的查询。目前使用 Cassandra 2.1 (DataStax 4.8)。

我需要做一些查询,比如在特定日期售出多少产品,在特定日期售出最多的产品,有多少以“A”开头的产品 ID 等等。

根据我的理解,使用 C*2 是不可行的。所以我的选择是 C*3 和 UDF 或使用 Sparks - 对吗?进入 Sparks 当然是一个很大的挑战,升级 C*3 和 UDF 学习也是一个额外的挑战。

如果有人可以建议阻力最小的路径,

谢谢

0 投票
1 回答
134 浏览

sql - 将带有“IN”运算符的 SQL 选择查询转换为 elasticsearch 搜索查询

我想将以下 SQL 查询转换为 Elasticsearch 搜索查询。谁能帮我解决这个问题,谢谢。

0 投票
3 回答
4161 浏览

mongodb - mongodb聚合中如何在多种情况下进行匹配和分组?

我有 4 名球员在不同的比赛中得分。例如

我试图找出一种方法,我可以使用聚合函数找到单人游戏的总和。

我也在为 b 重复同样的事情并继续

在镜头中,我为不同的用户做同样的事情太多次了。

什么是最好的方式或不同的方式或优化方式,所以我可以为所有用户编写一次聚合查询

0 投票
1 回答
1499 浏览

mongodb - mongodb 聚合查询 64 MB 限制

我确实有一个包含超过十亿个对象的表,如下所示:

它保存在 mongodb 3.2.11 上。

我每周插入近 5000 万条新记录,并且需要将新一周的记录与前一周的记录进行比较。

因此,我建立了一个这样的查询:

但是由于数据的大小,mongodb 无法计算结果。

错误如下:

断言:命令失败:{“ok”:0,“errmsg”:“BufBuilder 试图增长()到 134217728 字节,超过 64MB 限制。”,“代码”:13548 }

我试图将所有记录提取到 Python env 中,以便在那里计算结果,但是当我在 pymongo.aggregate 上运行以下管道时遇到了同样的错误:

它适用于较小规模的数据。如何使此查询更具可扩展性?有什么建议么?

非常感谢!

0 投票
1 回答
207 浏览

elasticsearch - 如何将每个文档的计数乘以其中的值?

假设我有很多这样的文件:

考虑到它出现的公式时间*数量,我将如何查询前 10 个最存在的bar[].identifier

编辑:我实现了这样的事情

但仍然不能乘以数量字段。

0 投票
2 回答
1429 浏览

elasticsearch - 如何过滤 ElasticSearch 中的热门术语聚合?

我有这样的orders文件:

我正在执行一个top_terms_aggregation以了解最畅销的产品。为了在全球范围内做到这一点,我使用:

但是,我将如何过滤给定的产品category_id?我尝试添加此过滤器:

但这会过滤具有给定类别的某些产品的订单本身,并且聚合被破坏。

我想获得属于给定类别的畅销产品。

0 投票
1 回答
2524 浏览

mongodb - 数组 MongoDB 按计数分组

这是我数据库中约 1000 万行中的一行:

这是一个游戏战斗的日志。牌组是一个阵列,由 8 张不同的牌组成。我正在尝试找到获胜次数最多的卡。可以通过比较皇冠来确定获胜者(我设法选择了玩家 1 获胜的所有文件)。

我想要达到的目标:

  1. 不幸的是,我无法执行组查询来返回我正在寻找的内容(获胜次数最多的卡片)。

  2. 我也在尝试找到最成功的套牌(获胜的数量就足够了——应该忽略该数组中指定的卡片顺序)。

我已经尝试过,但一段时间后返回了一个空错误:

我希望将所有套牌组合按其获胜次数分组(仅考虑 player1 获胜)

0 投票
2 回答
19193 浏览

nosql - 如何使用 DynamoDB 进行基本聚合?

dynamodb 如何实现聚合?Mongodb 和 couchbase 有 map reduce 支持。

假设我们正在构建一个技术博客,用户可以在其中发布文章。并说可以标记文章。

在用户界面中,我们要显示当前用户标签和相应的计数。

如何实现以下聚合?

我们将通过一个 rest api 提供这些数据,它会被频繁调用。就像此信息显示在应用程序主页中一样。

  • 我可以考虑提取所有文档并在应用程序级别进行聚合。但我觉得我的阅读能力单位会用尽
  • 可以使用 EMR、redshift、bigquery、aws lambda 等工具。但我认为这些是出于数据仓库的目的。

我想知道实现相同目标的其他更好的方法。考虑到成本和响应时间,人们如何选择 dynamodb 作为主要数据存储来实现像这样的动态简单查询。