问题标签 [buckets]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 如何在 SearchResponse 中使用 elasticSearch java api 访问聚合结果?
有没有办法使用 java API 在搜索响应中检索聚合的存储桶?
目前,可以获取聚合,但我不知道如何获取存储桶。
当前的 1.0 版本的 ElasticSearch (v1.0.0.Beta2) 仍然是 beta 版本,可能还需要添加这个功能,但也没有找到关于这一点的信息。
hive - 基于 Hive 分桶大小
我是 hive 新手,正在阅读有关 Bucketing 和 MapSide 连接的信息
“映射连接可以利用分桶表(Buckets),因为在左表的一个桶上工作的映射器只需要加载右表的相应桶来执行连接。连接的语法与for相同记忆中的……”
假设我创建一个表
CREATE TABLE bucketed_users (id INT, name STRING) CLUSTERED BY (id) INTO 4 BUCKETS;
我的问题是
1> 是否所有 4 个 Bucket 的大小都相同?还是取决于数据中 id 的频率?即,如果一个 id 重复很多,则相关存储桶的大小将高于其他存储桶。
2> 是否会出现与 id 相关的数据将出现在 2 个不同的存储桶中的情况?即一个 id 的记录存在于存储桶 1 中,而另一条记录存在于存储桶 4 中。
如果是,那么优化器将如何处理分桶数据?
如果有人尝试过,如果他们能分享他们的经验,那就太好了。
object - 试图弄清楚云是否/如何成为优势
与普通的 PhP/MySQL 相比,Cloud 的优势是什么?
一个典型的内容块大约是 30,000 段文本,每段长度不超过 300 个字符。
我正在查看一些关于桶和对象的好文档,并想知道是否有任何理由让我深入研究所有这些。
只是一个粗略的想法将不胜感激。我是不是找错了树,甚至为此想到了 Cloud?
ps 只是猜测:在云中运行 MySQL 的方法是什么?
couchbase - 更改 Couchbase 中现有存储桶的副本数?
我知道 Couchbase 2.2 不可能,但是是否可以更改 2.5 上的副本数?谢谢
amazon-web-services - 在 Web 应用程序上管理 amazon s3 上的存储桶
我想知道如何以最佳方式管理存储桶和我的应用程序之间的结构。
在我的网站上,不同脚本的上传图片很少,例如albums
orprofile picture
或time line pictures
1)你认为最好有3个不同的桶,每个类型的图片示例:
桶我的个人资料图片
bucketmyalbum图片
- 桶时间线图片
或者更好的是所有图片只有 1 个桶?
2)您如何根据您的应用程序构建您的存储桶?有更好的结构有什么标准吗?
python - Python:如何计算桶点
我有四个点 (1,2,3), (1,1,1),(23, 29, 0), (17, 0, 5),我需要做的就是将所有点移动到新位置(0,0,0), (0,0,0), (20,30,0), (20,0,10) 表示边长等于 10(长度 = 10)的立方体的中心点。
sitecore - 以编程方式使 Sitecore 项目可分桶
我在树结构中以编程方式生成许多站点核心内容项。举个例子,内容树中的结构如下所示:
现在,Subfolder1 中的所有子项都使用相同的模板,其他子文件夹也是如此。我想以编程方式使所有子文件夹都可以存储。我知道如何使用 Sitecore UI 来做到这一点,但在这种情况下这是不切实际的,因为会有数千个这样的子文件夹。那么,我该如何以编程方式做到这一点?
hash - 时间复杂度散列
我正在处理创建哈希表的任务,其中一个问题是
如果我们有 M 个文档,并且文档 D i由 N i个单词组成,那么这个简单的解决方案需要多长时间来搜索由 K 个单词组成的查询。用大 O 符号给出你的答案。
我认为答案会很大O(M⋅N)
。
此外,第二部分询问我们是否使用哈希函数更有效,并且所有单词在所有桶中均匀映射,大 O 表示法是什么?
我假设这个答案很大O(B/N)
,其中 B 是桶的数量。
这些是正确的吗?
hadoop - 在 Hive 表中选择正确数量的桶
我有 16 列的文本文件(user_id、date、other_attributes ......),整体文件的大小为 200GB,行数为 18 亿+。我创建了一个外部表(ex_raw_data)来读取这些数据。我有一个聚合脚本,可以生成 200 多个派生变量。当我在我的外部表(ex_raw_data)上运行查询时,由于我的文件是简单的文本文件并且行数和计算变量很大,因此需要花费大量时间来计算。现在我计划创建一个新的 hive 表,它将以 ORC 格式存储数据,但问题是我如何在创建表时确定正确的桶数。下面是我的集群配置(在 AWS 上)和 ORC 表结构:
决定我的 ORC 表中存储桶数量的最佳实践是什么(根据我上面的集群配置)?感谢你的帮助!
php - 无法对 Google Cloud Bucket 执行简单写入
我无法在我的 Google Cloud Bucket 上执行简单的写入操作。我已经按照文档进行了详细说明。这就是我所拥有的:一个默认存储桶,一个 php 脚本,所有需要启用的 api。
这是我的脚本
然而这不写。我错过了什么?