问题标签 [buckets]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
16961 浏览

python - Python Pandas 使用 pd.qcut 创建新的 bin/bucket 变量

如何在 python 中使用 pd.qut 创建一个新的 Bin/Bucket 变量?

对于有经验的用户来说,这似乎很简单,但我对此并不是很清楚,而且在堆栈溢出/谷歌上搜索令人惊讶地不直观。一些彻底的搜索产生了这个(qcut 作为新列的分配),但它并没有完全回答我的问题,因为它没有采取最后一步并将所有内容放入垃圾箱(即 1,2,...)。

0 投票
2 回答
1462 浏览

amazon-web-services - Auth0 和 S3 存储桶

我有个问题。我正在使用 Auth0 和 AWS SDK 访问 S3 上的一些存储桶。我有个问题。有没有办法在不使用存储桶策略的情况下限制对 S3 存储桶的访问?也许使用 Auth0 提供的元数据。

谢谢大家

0 投票
1 回答
299 浏览

sorting - Hive - 聚类并排序返回未排序的结果

我创建了一个带有桶的表,按如下方式聚集和排序:

数据是这样插入的:

当我查询时:

我得到未分类的结果。这是否意味着表格未排序?如果我将这个表与其他表连接起来,这个表上的排序合并连接会起作用ab

BDW:当我像这样查询 old_table(插入到包含的分发依据和排序依据)时:select * from old_table limit 100;我得到排序结果

0 投票
1 回答
138 浏览

algorithm - 使用分桶计数反转

我正在尝试计算数组中的反转(如果 a[i] > a[j] 和 i < j,则两个元素 a[i] 和 a[j] 形成反转)。我知道在 O(n^2) 中使用蛮力和在 O(nlgn) 中使用分而治之很容易解决这些问题。

我的问题是,是否有可能使用某种形式的分桶技术来实现 O(n) 的效率以及有关数据的知识。例如,我已经知道数组是 1-32 的排列,因此最大元素是 32(这意味着我们可以用分桶做一些事情)。

我一直在思考这个问题,注意到如果我们在一个桶中插入一个元素,那么在插入时大于它的所有桶的总和就是它的反转计数。但是如果我们每次都添加每个桶中的元素数量,那么它会导致我失去 O(n) 效率。有关如何保持计数以消除此惩罚的任何建议。

请注意,排列可以是任意长度,但在执行过程中我们知道排列中元素的数量。因此,“n”的值在执行期间是已知的,并且排列由从“1”到“n”的元素组成。

排序:可以以 O(n) 的时间复杂度对该数据集进行排序,因为我们可以创建 32 个桶,并且我们知道每个桶将只有一个元素。因此,对于这个特定示例,O(n + M) 的桶排序的效率为 O(n + 1) = O(n)。

0 投票
2 回答
883 浏览

c++11 - std::unordered_map 锁定桶数

我正在尝试对 C++11 的 std::unordered_map 容器进行性能基准测试。

我想看看容器的负载因子如何影响插入的性能。特别是因为我有兴趣使用哈希表作为基本数据结构来查找大量数字中的对。

据我了解文档,这似乎是不可能的。我可以用 a 设置存储桶的数量,rehash()但只要超过它就会自动完成max_load_factor

我可以设置,max_load_factor但据我了解,这仅确定何时执行重新哈希,它不允许将表置于重压下,这是我想要做的。

我有什么办法可以硬限制哈希表中的存储桶数量吗?

0 投票
0 回答
147 浏览

node.js - nodejs 将图像上传到存储桶并为其提供“共享宣传”属性

有一些关于上传图片和分享的问题。我找到了相关的问题和答案,但它现在可以工作了。谷歌云响应此错误

NodeJS gcloud - 使用公共读取属性/自定义缓存过期上传到谷歌存储

理想情况下,我想上传一个文件,然后通过公共域访问它。我不想有任何流媒体解决方案,就像通过 api 打开文件一样。

谢谢!

0 投票
0 回答
74 浏览

python - 大熊猫中的两级分桶

我是 pandas 的新手,我回顾了一些列出的存储桶数据框的解决方案,但似乎没有一个是我的答案。我有一个时间序列数据,我不打算对它们进行重采样,我想将整个数据分成 7 组,每组分成 10 个相等的桶。我确信必须有非常直接的方法,而不是在这里使用索引。

更多细节

数据框

我想将刻度分为 7 个,每个指向精确的 10 个现货桶,然后其他列可以使用聚合功能达到现货桶级别,这将是总共 7X10 条记录。

0 投票
1 回答
884 浏览

hive - 桶没有在 hadoop-hive 上创建

我正在尝试使用以下命令在配置单元中创建一个存储桶:

命令执行成功:当我将数据加载到这个表中时,它执行成功并且使用时显示所有数据select * from emp

但是,在 HDFS 上,它只创建一个表,并且只有一个包含所有数据的文件。也就是说,没有特定国家/地区记录的文件夹。

0 投票
2 回答
251 浏览

hashmap - 为什么 LinkedList 作为 HashMap 的存储桶实现而不是另一个 Hashmap?

有谁知道为什么选择 HashMap 的存储桶通过 LinkedList 而不是另一个 Hashmap 来实现。如果桶本身变成了 HashMap,那么 contains 或 get 似乎是 O(1) 而不是摊销 O(1)。

0 投票
1 回答
794 浏览

sitecore - 在 Sitecore 中使用 QueryBuilder 字段类型限制存储桶搜索

在我们的 Sitecore 应用程序中,我们有一个名为 NewsArticleSlide 的模板,它在轮播幻灯片上呈现新闻文章。此模板有一个名为“新闻文章”的字段,其中包含正在呈现的新闻文章的 ID。到目前为止,此字段的类型一直是 droplink,它非常适合从树中选择单个项目,并指定该树的根应该是什么。

现在我们决定将所有新闻文章包含在一个名为“新闻”的存储桶中。问题是我们现在不能使用 droplink 从存储桶中选择一个项目,并且不存在“带搜索的 droplink”字段类型。

QueryBuilder 似乎是最合适的,因为它使我们能够从存储桶中选择单个项目。但是,当我们最初运行搜索时,Sitecore 中的所有内容都会返回,然后我们必须按模板过滤以仅查看新闻文章。

我们要做的是通过指定搜索的起点来预过滤搜索,并将搜索限制为仅返回特定模板的项目。我们假设我们可以使用模板字段的源中的参数来执行此操作,但没有成功。

有谁知道我们该怎么做?QueryBuilder 是正确的方法吗?