问题标签 [buckets]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2071 浏览

algorithm - 计算加权分配比率的算法

这是我面临的问题。我有一些物品。然后,我有不同数量的带有重量(介于 0 和 1 之间)的桶连接到它们。我正在尝试计算每个存储桶中应该放入的项目的百分比。

例如,假设我有 20 个项目和 3 个桶:

  • B1 - 重量:0.5
  • B2 - 重量:0.5
  • B3 - 重量:0.25

那么百分比将是:

  • B1 - 40% 的项目 = 8 个项目
  • B2 - 40% 的项目 = 8 个项目
  • B3 - 20% 的项目 = 4 个项目

该百分比应增加到 100%,以便将所有项目分配到存储桶中。在上面的例子中,B1 和 B2 的物品数量都应该是 B3 的两倍,因为它们的重量是 B3 的两倍;但是,当所有 3 个桶放在一起时,B1 获得的项目的实际百分比是 40%。

是否已经有一种算法可以解决这个问题,或者你们中的任何人都知道如何解决它?

0 投票
1 回答
364 浏览

elasticsearch - Elasticsearch 聚合查询

我正在做一个关于烹饪食谱的项目。我安装了 Elasticsearch 1.5.2,并在超市的许多索引中添加了很多蔬菜或肉类等产品。在我开始聚合查询之前一切都很好。例如:要制作土豆泥,我需要土豆、豆类、鹰嘴豆、西兰花、牛奶、胡椒粉、盐。我已经储存了所有这些产品。我需要进行一次查询以在所有索引中搜索该产品中最便宜的。我尝试了很多查询,但没有找到我需要的。

这是示例,所有这些查询都有效,但我需要在一个查询中得到它们的结果:

我只想有一个查询来获取所有这些查询的结果,我只想要最便宜的查询,而不是所有列表。

0 投票
1 回答
196 浏览

c++ - 哈希表上没有匹配函数

当我尝试从以下代码行调用创建哈希函数时,我收到错误 no matching function for call

这个想法是 create 从 KeyValuePair 类接收键,然后该方法将散列键,转到该存储桶,然后插入键值对。我相信我收到了这个错误,因为我没有输出到字符串。但是,我无法弄清楚使用 create 方法将键值对正确输出到字符串的语法。(我正在使用std::list,我的KeyValuePair班级运作正常)

0 投票
1 回答
1021 浏览

amazon-web-services - AWS:存储桶名称是什么?

我想从 AWS 设置 CodeDeploy,我正在遵循本指南:

是什么bucket-name?正如我所看到bucket的,但是我如何能够从中下载一些东西?我说的是这个命令:

0 投票
1 回答
285 浏览

amazon-web-services - 当我在创建存储桶时看到“错误,访问被拒绝”时,我在哪里/编码什么?

我是使用 AWS(和 SO)的新手,我正在关注机器学习教程,它要求您创建一个存储桶。但是,当我尝试创建存储桶时,它一直说“错误访问被拒绝”,让我填写一些属性,但仍然显示访问被拒绝。我已经仔细研究了这个问题很长一段时间,有很多建议说要更正“Sid”、“Action”、“Effect”、“Allow”等的代码。但是,我不明白这是否是我的问题,如果是,在哪里写这段代码?我将展示一些屏幕截图,它显示给我,我打开了一个文件,其中显示了与存储桶相关的代码。非常感谢,我会仔细阅读每一个答案,我很抱歉 尝试创建存储桶时我的屏幕截图

当我点击这个名为“alphaindex.h”的文件时的文件列表

0 投票
2 回答
1247 浏览

apache - 为什么蜂巢中的桶数应该等于减速器的数量?

在 hive 中,为什么桶的数量应该等于减速器的数量?

0 投票
1 回答
506 浏览

oracle - Oracle SQL NTILE - 平均分配

这个查询:

有了这个数据

有这个结果:

SQL总和(数量)分布更均匀,还有其他可能性吗?

我知道有很多算法,但我很确定必须有智能SQL(分析函数)解决方案,例如。

0 投票
1 回答
1145 浏览

scala - Spark Bucketizer - 即使没有元素也显示所有桶

我有一个从 spark 数据框生成的事件列表,如下所示。我正在使用带有 Scala 的 Spark 2.2.0。

+-----+-----+----------+ |event|hour | day| +-----+-----+----------+ |event1| 18|2015-02-05| |event1| 17|2015-02-19| |event5| 18|2015-02-02| |event5| 19|2015-02-02| |event1| 1|2015-03-17| |event1| 0|2015-02-03| |event1| 20|2015-02-02| |event1| 22|2015-02-02| |event1| 23|2015-02-02| |event1| 18|2015-02-09| |event1| 19|2015-02-09| |event1| 21|2015-02-09| |event1| 21|2015-04-06| |event1| 23|2015-02-09| |event1| 20|2015-02-16| |event2| 19|2015-02-12| |event3| 18|2015-02-18| |event1| 22|2015-02-16| |event2| 17|2015-02-04| |event1| 23|2015-02-16| +-----+----+----------+ only showing top 20 rows

我需要创建每小时存储桶并计算每小时发生的事件数。所以我的方法是创建存储桶(其中 24 个)并计算其特定时间段中的事件,如下所示。

上面代码的结果是

+----------+------+-----+ | day|bucket|count| +----------+------+-----+ |2015-05-21| 0.0| 1| |2015-05-21| 2.0| 1| |2015-05-21| 11.0| 1| |2015-05-21| 17.0| 1| |2015-05-21| 18.0| 4| |2015-05-21| 19.0| 4| |2015-05-21| 21.0| 1| |2015-05-21| 22.0| 3| |2015-05-21| 23.0| 1| +----------+------+-----+

哪个是对的。然而,我所期望的输出是这样的:

+----------+------+-----+ | day|bucket|count| +----------+------+-----+ |2015-05-21| 0.0| 1| |2015-05-21| 1.0| 0| |2015-05-21| 2.0| 1| |2015-05-21| 3.0| 0| |2015-05-21| 4.0| 0| |2015-05-21| 5.0| 0| : : |2015-05-21| 11.0| 1| |2015-05-21| 12.0| 0| |2015-05-21| 13.0| 0| : : |2015-05-21| 17.0| 1| |2015-05-21| 18.0| 4| |2015-05-21| 19.0| 4| |2015-05-21| 20.0| 0| |2015-05-21| 21.0| 1| |2015-05-21| 22.0| 3| |2015-05-21| 23.0| 1| +----------+------+-----+

基本上,没有事件的箱(桶)应该填充 0。知道如何实现吗?

谢谢!

0 投票
0 回答
62 浏览

algorithm - 防止值在两个“桶”边缘时在两个值之间反弹的算法策略

我正在实时跟踪 OpenCV (Python) 中的各种彩球。跟踪非常稳定。即,当静止时,圆心的值不会改变超过 1 / 2 个像素。

但是,我遇到了一个肯定是经过充分研究的问题:我现在需要将球的位置放入更粗糙的网格中 - 基本上只是简单地划分(+四舍五入)x,y位置。

例如

所以我这样做:地板(输入/ 5)

这很好,但是当初始值的微小变化可能导致它在分区的“边缘”或“敏感”区域快速更改输出单个 Ie 时,就会出现问题。

即值 4 和 5(落在 1 个像素错误/“噪声”边距内)会导致输出快速变化。

有哪些策略/算法可以处理这些问题,从而进一步帮助我?

我进行了搜索,但似乎我不知道如何为 Google(或 StackOverflow)正确表达问题。

我尝试添加“死区”。即,而不是纯粹划分我在我的输出范围内留下“间隙”,这意味着一个值有时没有输出(即在“桶”之间)。这有点工作,但意味着我有很多未使用的屏幕(即波动范围)......

IE

时间平均并不理想(也不能很好地工作) - 并增加了延迟。

我只是有一个“预感”,有一整套关于此的计算机/信号科学。

0 投票
1 回答
26 浏览

histogram - Keen.IO - 按数值而不是时间/直方图分桶结果

使用 Keen.io API,我有一个带有数字参数的事件,并希望在参数值的范围内对结果进行分桶。例如,会话持续时间:我想计算在值范围内的 20 个桶中每个桶中发生的会话持续时间的数量。另一种看待这一点的方法是生成数据的直方图。