问题标签 [buckets]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1039 浏览

c - 从 C 中的双向链表中删除重复项

我正在尝试使用 200-800 之间的 SAT 成绩的双向链接列表。我需要从列表中的所有重复项中删除,即通过删除所有重复项来确保每个成绩只出现一次。

请帮助我了解问题所在。


这是固定代码,但仍然无法正常工作。现在它编译但屏幕上没有显示任何内容。顺便说一句,我不需要删除头部,因为第一个数字永远不能重复......但我会处理它以防头部为空;
我还将我要删除的单元格的前一个单元格发送到函数 deleteFromList。它仍然不起作用。有任何想法吗?谢谢!

0 投票
2 回答
2206 浏览

ruby - 在 S3 存储桶中复制文件(红宝石)

我正在使用 gem aws-sdk-ruby 并且我想将文件 /images/image_a.png 复制到 /profile.png 都位于同一个存储桶中。

我怎样才能做到这一点?

0 投票
1 回答
2064 浏览

hash - 具有给定搜索键值的文件的可扩展散列

我知道 SO 可能是寻找此类问题答案的错误地方,但目前我需要答案以及如何紧急逐步解决。

假设我们正在对包含具有以下搜索键值的记录的文件使用可扩展散列:2、3、5、7、11、17、19、23、29、31 显示该文件的可扩展散列结构,如果哈希函数是 h(x) = x mod 8 并且桶可以保存三个记录。

编辑:我对此有“假定”的答案:http: //i.imgur.com/CW8H8vG.png 但我不确定这是否正确,因为当我解决它时,我得到了不同的哈希结构。如果它是正确的,有人可以向我解释为什么吗?

0 投票
1 回答
299 浏览

javascript - 为什么函数不返回值?

我有一个使用库 Buckets 的 javaScript 函数,它应该将值返回给 html。我使用 console.log 查看函数内部的数据,它不为空。但是在html上,它说“未定义”。

这是我的 js 代码:

这是在我调用 transformToStruct 函数的 html 页面上:

有任何想法吗?

0 投票
1 回答
1991 浏览

join - HIVE - 桶连接的用例是什么

我似乎找不到任何在 hive 中加入桶的好的用例。
如我所见,当将表 A 与表 B 连接时:
桶连接为我们节省了将表 A 传递给减速器的时间,同时将表 B 加载到分布式缓存中,并且每个映射器处理表 B 的相应桶与表的桶一个。

但是,将表 B 加载到分布式缓存中是由单个任务完成的,因此随着表变大,这将成为一个瓶颈。
因此,如果表 B 足够小,不会对单个任务造成负担,那么它实际上与使用小优化进行常规 map-join 相同。

另一方面,如果表 B 不能放入具有整体的单个映射器中,则将其读取到分布式缓存的过程可能需要一段时间。

最后,似乎将表 B 加载到分布式缓存中的时间可能是值得的,因为我们不需要将表 A 的存储桶从映射器传递到减速器,但是这个过程不应该太繁重,除非表 A确实很大,因为每个映射器都会读取一个对应于单个减速器的存储桶(表由连接键存储)每个减速器获取 2 个中间输出(每个表一个,减速器运行在与其对应的映射器相同的节点)并合并它们,从这一点开始,连接与映射器中的连接相同。

总而言之,我认为问题是什么成本更高:

  1. 通过单个任务将中等大小的表加载到分布式缓存中
  2. 将许多中等(可能很大)大小的桶从映射器传递到减速器(主要是本地)并合并 2 个文件 - 所有这些都是并行完成的。

你怎么看?有人能找到桶加入的好用法吗?

0 投票
2 回答
986 浏览

regex - 使用 s3cmd 过滤结果

我正在为 AWS S3 使用名为 s3cmd 的 cmd 工具。我正在尝试“获取”由名称目录名称的前面部分过滤的文件夹集,例如“/192.168.*/”。基本上我有很多目录的 S3 存储桶,我只需要几个以特定字符串开头的目录。这是我到目前为止所拥有的。将不胜感激任何帮助:) 谢谢!

上面的代码从 /logfiles/ 中拉下所有目录。:(

0 投票
1 回答
1042 浏览

amazon-web-services - 无法删除 AWS S3 存储桶

我正在使用 AWS Java SDK。所以我玩了 S3,现在我遇到了以下情况:我的 AWS Explorer 中显示了一个存储桶,如果我检索

我得到一个 1 号的尺寸。但是,如果我尝试列出或删除它,我会收到错误消息:

0 投票
3 回答
35547 浏览

optimization - Hive - 两个表的高效连接

我正在加入 Hive 中的两个大表(一个超过 10 亿行,一个是大约 1 亿行),如下所示:

我已经以相同的方式对这两个表进行了分桶,按 id 将每个表聚类为 100 个桶,但查询仍然需要很长时间。

关于如何加快速度的任何建议?

0 投票
2 回答
781 浏览

javascript - 散列电子邮件(或用户名)以存储在 redis 散列桶中

我正在编写一个依赖redis作为其主数据库的node.js应用程序,用户信息存储在这个数据库中。

我目前将用户数据(电子邮件、密码、创建日期等)保存在名称为user:(incremental uid). email:(email)和一个有价值的钥匙(same incremental uid)

当有人登录时,应用程序会查找与电子邮件匹配的密钥,email:(email)以返回(incremental uid)访问用户数据的user:(incremental uid).

这很有效,但是,如果用户数量达到数百万(可能,但有点遥远的问题),我的数据库大小将急剧增加,我将开始遇到一些问题。

我想知道如何将电子邮件哈希到一个整数,我可以用它来分类像这样的哈希桶(伪代码):

然后,当我需要为 email 查找这个 uid 时thisguy@somedomain.com,我使用类似的过程:

所以,我的问题以列表形式:

  1. 这是实用的/有更好的方法吗?
  2. 如何将电子邮件散列到几位数字?
  3. 将这些哈希组织到桶中的最佳方法是什么?
0 投票
1 回答
300 浏览

algorithm - 将石头分配到桶中(不是微不足道的)/ Integer Bin Packing Upper bound

假设你有 k 块石头和 m 块石头类型你有 f1 块石头来自第一种类型,f2 来自第二种类型,依此类推。

(即总和(f_i)= k)。

此外,我们得到一个正整数 r。

最少需要多少个桶,这样我们才能将石头类型分配到每个桶的大小不超过 r 的桶中?(我们也知道对于每个 i,f_i <= r)。

这个问题实际上是某种装箱问题,所以我不确定它是否有确切的答案,但我们可以给它一个上限吗?

一个微不足道的上限的例子是 m,因为这将允许我们将每种石头类型打包在他自己的桶中。

一个不起作用的界限的例子是 k/r。原因是如果k=9,r=3,我们有5种石头,f1=2,f2=2,f3=2,f4=2,f5=1,

那么无论我们如何划分石头类型,都必须有一个大小> = 4的桶。

同一类型的所有石头都必须放在同一个桶中。

有什么建议么 :) ?

编辑:m 和 f_i 是未知的,我正在寻找一个界限,它使我能够为所有 (m,f_i's) 组合分配石头。

另一个例子:假设 r = 3。我将证明 k/2 个桶就足够了:

让我们用 x 表示有 3 块石头的类型数量。y 将表示恰好有 2 颗宝石的类型数量,z 将表示单颗宝石类型的数量。

根据定义:3x + 2y + z = k。我们可以为 3 块石头类型分配 x 个桶。

如果 (y > z) {第一种情况}:将其中一个 y 类型与其中一个 z 类型一起放入一个桶中{我们有 z 个这样的桶}。

将其余的 y 类型放在一个桶中。

由于 y > z 我们使用了 x+y 桶,并且由于 3x + 2y + z = k => x+y <= k/2。

if (z >= y) {第二种情况}:很容易看出我们可以把所有的石头都装在 k/3 个桶中(每个桶都可以装满,正好包含 3 块石头)。

此外,对于 r=3,这将其绑定得很紧(如果 x=z=0 和 y=k/2,那么我们正好需要 k/2 个桶)。

现在的问题是:k/2 个桶是否适用于所有 r 值?

我可以证明 2k/(r+1) 个桶的下限(即紧实例),但它与 k/2 相差甚远。任何人都可以收紧界限吗?