问题标签 [buckets]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - 计算加权分配比率的算法
这是我面临的问题。我有一些物品。然后,我有不同数量的带有重量(介于 0 和 1 之间)的桶连接到它们。我正在尝试计算每个存储桶中应该放入的项目的百分比。
例如,假设我有 20 个项目和 3 个桶:
- B1 - 重量:0.5
- B2 - 重量:0.5
- B3 - 重量:0.25
那么百分比将是:
- B1 - 40% 的项目 = 8 个项目
- B2 - 40% 的项目 = 8 个项目
- B3 - 20% 的项目 = 4 个项目
该百分比应增加到 100%,以便将所有项目分配到存储桶中。在上面的例子中,B1 和 B2 的物品数量都应该是 B3 的两倍,因为它们的重量是 B3 的两倍;但是,当所有 3 个桶放在一起时,B1 获得的项目的实际百分比是 40%。
是否已经有一种算法可以解决这个问题,或者你们中的任何人都知道如何解决它?
elasticsearch - Elasticsearch 聚合查询
我正在做一个关于烹饪食谱的项目。我安装了 Elasticsearch 1.5.2,并在超市的许多索引中添加了很多蔬菜或肉类等产品。在我开始聚合查询之前一切都很好。例如:要制作土豆泥,我需要土豆、豆类、鹰嘴豆、西兰花、牛奶、胡椒粉、盐。我已经储存了所有这些产品。我需要进行一次查询以在所有索引中搜索该产品中最便宜的。我尝试了很多查询,但没有找到我需要的。
这是示例,所有这些查询都有效,但我需要在一个查询中得到它们的结果:
我只想有一个查询来获取所有这些查询的结果,我只想要最便宜的查询,而不是所有列表。
c++ - 哈希表上没有匹配函数
当我尝试从以下代码行调用创建哈希函数时,我收到错误 no matching function for call
这个想法是 create 从 KeyValuePair 类接收键,然后该方法将散列键,转到该存储桶,然后插入键值对。我相信我收到了这个错误,因为我没有输出到字符串。但是,我无法弄清楚使用 create 方法将键值对正确输出到字符串的语法。(我正在使用std::list
,我的KeyValuePair
班级运作正常)
amazon-web-services - AWS:存储桶名称是什么?
我想从 AWS 设置 CodeDeploy,我正在遵循本指南:
是什么bucket-name
?正如我所看到bucket
的,但是我如何能够从中下载一些东西?我说的是这个命令:
amazon-web-services - 当我在创建存储桶时看到“错误,访问被拒绝”时,我在哪里/编码什么?
我是使用 AWS(和 SO)的新手,我正在关注机器学习教程,它要求您创建一个存储桶。但是,当我尝试创建存储桶时,它一直说“错误访问被拒绝”,让我填写一些属性,但仍然显示访问被拒绝。我已经仔细研究了这个问题很长一段时间,有很多建议说要更正“Sid”、“Action”、“Effect”、“Allow”等的代码。但是,我不明白这是否是我的问题,如果是,在哪里写这段代码?我将展示一些屏幕截图,它显示给我,我打开了一个文件,其中显示了与存储桶相关的代码。非常感谢,我会仔细阅读每一个答案,我很抱歉 尝试创建存储桶时我的屏幕截图
apache - 为什么蜂巢中的桶数应该等于减速器的数量?
在 hive 中,为什么桶的数量应该等于减速器的数量?
oracle - Oracle SQL NTILE - 平均分配
这个查询:
有了这个数据
有这个结果:
SQL
总和(数量)分布更均匀,还有其他可能性吗?
我知道有很多算法,但我很确定必须有智能SQL
(分析函数)解决方案,例如。
scala - Spark Bucketizer - 即使没有元素也显示所有桶
我有一个从 spark 数据框生成的事件列表,如下所示。我正在使用带有 Scala 的 Spark 2.2.0。
+-----+-----+----------+
|event|hour | day|
+-----+-----+----------+
|event1| 18|2015-02-05|
|event1| 17|2015-02-19|
|event5| 18|2015-02-02|
|event5| 19|2015-02-02|
|event1| 1|2015-03-17|
|event1| 0|2015-02-03|
|event1| 20|2015-02-02|
|event1| 22|2015-02-02|
|event1| 23|2015-02-02|
|event1| 18|2015-02-09|
|event1| 19|2015-02-09|
|event1| 21|2015-02-09|
|event1| 21|2015-04-06|
|event1| 23|2015-02-09|
|event1| 20|2015-02-16|
|event2| 19|2015-02-12|
|event3| 18|2015-02-18|
|event1| 22|2015-02-16|
|event2| 17|2015-02-04|
|event1| 23|2015-02-16|
+-----+----+----------+
only showing top 20 rows
我需要创建每小时存储桶并计算每小时发生的事件数。所以我的方法是创建存储桶(其中 24 个)并计算其特定时间段中的事件,如下所示。
上面代码的结果是
+----------+------+-----+
| day|bucket|count|
+----------+------+-----+
|2015-05-21| 0.0| 1|
|2015-05-21| 2.0| 1|
|2015-05-21| 11.0| 1|
|2015-05-21| 17.0| 1|
|2015-05-21| 18.0| 4|
|2015-05-21| 19.0| 4|
|2015-05-21| 21.0| 1|
|2015-05-21| 22.0| 3|
|2015-05-21| 23.0| 1|
+----------+------+-----+
哪个是对的。然而,我所期望的输出是这样的:
+----------+------+-----+
| day|bucket|count|
+----------+------+-----+
|2015-05-21| 0.0| 1|
|2015-05-21| 1.0| 0|
|2015-05-21| 2.0| 1|
|2015-05-21| 3.0| 0|
|2015-05-21| 4.0| 0|
|2015-05-21| 5.0| 0|
:
:
|2015-05-21| 11.0| 1|
|2015-05-21| 12.0| 0|
|2015-05-21| 13.0| 0|
:
:
|2015-05-21| 17.0| 1|
|2015-05-21| 18.0| 4|
|2015-05-21| 19.0| 4|
|2015-05-21| 20.0| 0|
|2015-05-21| 21.0| 1|
|2015-05-21| 22.0| 3|
|2015-05-21| 23.0| 1|
+----------+------+-----+
基本上,没有事件的箱(桶)应该填充 0。知道如何实现吗?
谢谢!
algorithm - 防止值在两个“桶”边缘时在两个值之间反弹的算法策略
我正在实时跟踪 OpenCV (Python) 中的各种彩球。跟踪非常稳定。即,当静止时,圆心的值不会改变超过 1 / 2 个像素。
但是,我遇到了一个肯定是经过充分研究的问题:我现在需要将球的位置放入更粗糙的网格中 - 基本上只是简单地划分(+四舍五入)x,y位置。
例如
所以我这样做:地板(输入/ 5)
这很好,但是当初始值的微小变化可能导致它在分区的“边缘”或“敏感”区域快速更改输出单个 Ie 时,就会出现问题。
即值 4 和 5(落在 1 个像素错误/“噪声”边距内)会导致输出快速变化。
有哪些策略/算法可以处理这些问题,从而进一步帮助我?
我进行了搜索,但似乎我不知道如何为 Google(或 StackOverflow)正确表达问题。
我尝试添加“死区”。即,而不是纯粹划分我在我的输出范围内留下“间隙”,这意味着一个值有时没有输出(即在“桶”之间)。这有点工作,但意味着我有很多未使用的屏幕(即波动范围)......
IE
时间平均并不理想(也不能很好地工作) - 并增加了延迟。
我只是有一个“预感”,有一整套关于此的计算机/信号科学。
histogram - Keen.IO - 按数值而不是时间/直方图分桶结果
使用 Keen.io API,我有一个带有数字参数的事件,并希望在参数值的范围内对结果进行分桶。例如,会话持续时间:我想计算在值范围内的 20 个桶中每个桶中发生的会话持续时间的数量。另一种看待这一点的方法是生成数据的直方图。