12

我正在使用 Oracle 数据库,我需要能够对表中的数据进行分区。我知道 Rracle 有一个 ora_hash 函数,可以将数据分区到桶中。ora_hash 函数是确定性的吗?

在我的程序中,我将进行几个不同的数据库查询,每个查询都要求不同的存储桶编号。

例如,在一个查询中,我可能会询问前两个存储桶:

SELECT * FROM sales WHERE ORA_HASH(cust_id, 9) in (0,1);

在随后的查询中,我可能会要求第二个和第三个存储桶:

SELECT * FROM sales WHERE ORA_HASH(cust_id, 9) in (1,2);

在上面的例子中,ora_hash 是否总是将表分成完全相同的 10 个桶?假设表中的数据没有改变。第二个存储桶(存储桶 1)在两个查询中是否相同?

有文档表明种子值使 oracle 能够为同一数据集返回不同的结果。所以我假设如果我不使用种子值,那么 ora_hash 将是确定性的。请参阅文档

4

2 回答 2

16

ORA_HASH对于可用于分区的数据类型(例如 NUMBER、VARCHAR、DATE 等)绝对是确定性的。

但至少对于某些其他数据类型(例如 CLOB)而言,这不是ORA_HASH确定性的。


我的回答基于Jonathan Lewis 的这篇关于ORA_HASH.

乔纳森刘易斯没有明确说它们是确定性的,但他确实提到ORA_HASH“似乎是内部使用的函数 - 种子为零 - 以确定行属于散列分区表中的哪个分区”。如果它用于哈希分区,那么它必须是确定性的,否则分区连接将不起作用。

要显示ORA_HASH某些数据类型可能是不确定的,请运行以下查询。它来自同一篇文章中的评论:

with src as (select to_clob('42') val from dual connect by level<=5)
select val,ora_hash(val,7) from src order by 2;

令人惊讶的是,同样的问题也发生在dbms_sqlhash.gethash.

于 2012-02-28T05:06:11.463 回答
5

Jon Heller 的回答有更多细节,所以请投票支持他的回答。由于这仍然是公认的答案,我将内联他的部分回复:

ORA_HASH对于可用于分区的数据类型(例如NUMBER, VARCHAR,DATE等)绝对是确定性的。

ORA_HASH至少对于其他一些数据类型(例如CLOB.

于 2012-02-26T04:02:35.900 回答