问题标签 [buckets]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

99 问题

0 投票

2 回答

16961 浏览

python - Python Pandas 使用 pd.qcut 创建新的 bin/bucket 变量

如何在 python 中使用 pd.qut 创建一个新的 Bin/Bucket 变量？

对于有经验的用户来说，这似乎很简单，但我对此并不是很清楚，而且在堆栈溢出/谷歌上搜索令人惊讶地不直观。一些彻底的搜索产生了这个（qcut 作为新列的分配），但它并没有完全回答我的问题，因为它没有采取最后一步并将所有内容放入垃圾箱（即 1,2，...）。

2015-02-10T22:20:23.780

0 投票

2 回答

1462 浏览

amazon-web-services - Auth0 和 S3 存储桶

我有个问题。我正在使用 Auth0 和 AWS SDK 访问 S3 上的一些存储桶。我有个问题。有没有办法在不使用存储桶策略的情况下限制对 S3 存储桶的访问？也许使用 Auth0 提供的元数据。

谢谢大家

amazon-web-services amazon-s3 amazon buckets auth0

2015-02-23T23:52:46.877

0 投票

1 回答

299 浏览

sorting - Hive - 聚类并排序返回未排序的结果

我创建了一个带有桶的表，按如下方式聚集和排序：

数据是这样插入的：

当我查询时：

我得到未分类的结果。这是否意味着表格未排序？如果我将这个表与其他表连接起来，这个表上的排序合并连接会起作用a吗b？

BDW：当我像这样查询 old_table（插入到包含的分发依据和排序依据）时：select * from old_table limit 100;我得到排序结果

sorting hive clustered-index buckets

2015-02-25T11:33:43.603

0 投票

1 回答

138 浏览

algorithm - 使用分桶计数反转

我正在尝试计算数组中的反转（如果 a[i] > a[j] 和 i < j，则两个元素 a[i] 和 a[j] 形成反转）。我知道在 O(n^2) 中使用蛮力和在 O(nlgn) 中使用分而治之很容易解决这些问题。

我的问题是，是否有可能使用某种形式的分桶技术来实现 O(n) 的效率以及有关数据的知识。例如，我已经知道数组是 1-32 的排列，因此最大元素是 32（这意味着我们可以用分桶做一些事情）。

我一直在思考这个问题，注意到如果我们在一个桶中插入一个元素，那么在插入时大于它的所有桶的总和就是它的反转计数。但是如果我们每次都添加每个桶中的元素数量，那么它会导致我失去 O(n) 效率。有关如何保持计数以消除此惩罚的任何建议。

请注意，排列可以是任意长度，但在执行过程中我们知道排列中元素的数量。因此，“n”的值在执行期间是已知的，并且排列由从“1”到“n”的元素组成。

排序：可以以 O(n) 的时间复杂度对该数据集进行排序，因为我们可以创建 32 个桶，并且我们知道每个桶将只有一个元素。因此，对于这个特定示例，O(n + M) 的桶排序的效率为 O(n + 1) = O(n)。

algorithm buckets bucket-sort

2015-03-08T06:43:59.817

0 投票

2 回答

883 浏览

c++11 - std::unordered_map 锁定桶数

我正在尝试对 C++11 的 std::unordered_map 容器进行性能基准测试。

我想看看容器的负载因子如何影响插入的性能。特别是因为我有兴趣使用哈希表作为基本数据结构来查找大量数字中的对。

据我了解文档，这似乎是不可能的。我可以用 a 设置存储桶的数量，rehash()但只要超过它就会自动完成max_load_factor。

我可以设置，max_load_factor但据我了解，这仅确定何时执行重新哈希，它不允许将表置于重压下，这是我想要做的。

我有什么办法可以硬限制哈希表中的存储桶数量吗？

c++11 benchmarking unordered-map buckets

2015-03-27T08:23:39.490

0 投票

0 回答

147 浏览

node.js - nodejs 将图像上传到存储桶并为其提供“共享宣传”属性

有一些关于上传图片和分享的问题。我找到了相关的问题和答案，但它现在可以工作了。谷歌云响应此错误

NodeJS gcloud - 使用公共读取属性/自定义缓存过期上传到谷歌存储

理想情况下，我想上传一个文件，然后通过公共域访问它。我不想有任何流媒体解决方案，就像通过 api 打开文件一样。

谢谢！

node.js google-cloud-storage buckets

2015-04-02T09:29:52.063

0 投票

0 回答

74 浏览

python - 大熊猫中的两级分桶

我是 pandas 的新手，我回顾了一些列出的存储桶数据框的解决方案，但似乎没有一个是我的答案。我有一个时间序列数据，我不打算对它们进行重采样，我想将整个数据分成 7 组，每组分成 10 个相等的桶。我确信必须有非常直接的方法，而不是在这里使用索引。

问题标签 [buckets]

python - Python Pandas 使用 pd.qcut 创建新的 bin/bucket 变量

amazon-web-services - Auth0 和 S3 存储桶

sorting - Hive - 聚类并排序返回未排序的结果

algorithm - 使用分桶计数反转

c++11 - std::unordered_map 锁定桶数

node.js - nodejs 将图像上传到存储桶并为其提供“共享宣传”属性

python - 大熊猫中的两级分桶

更多细节

数据框

hive - 桶没有在 hadoop-hive 上创建

hashmap - 为什么 LinkedList 作为 HashMap 的存储桶实现而不是另一个 Hashmap？

sitecore - 在 Sitecore 中使用 QueryBuilder 字段类型限制存储桶搜索

问题标签 [buckets]

更多细节

数据框

Reference