32

我有一个 postrges 数据库,其中一个表包含我使用 python 函数生成的关键代码。我希望能够对该列进行散列,以便每次将键代码添加到其中时,对键进行散列。我怎样才能让 postgres 做到这一点?或者存储这些代码的最佳方式是什么。这是我想在我的表中散列的列的示例。

 key_codes | 
-----------+
 L7G4J83K  |        
 J70KG169  |         
 L69E540K  |        
 GL8E9C3J  |         
 6C0LE215  |         
 9G01C8JA  |         
 1G9KC58A  |         
4

3 回答 3

57

使用触发器在插入和更新时设置哈希列。对于 SHA-256,请使用pgcrypto扩展模块的digest功能

由于您没有指定您的 PostgreSQL 版本,我将假设您在以下示例中使用当前的 9.2。

以下是调用 sha256 摘要函数的方法:

regress=# CREATE EXTENSION pgcrypto;
CREATE EXTENSION

regress=> SELECT digest('blah', 'sha256');
                               digest                               
--------------------------------------------------------------------
 \x8b7df143d91c716ecfa5fc1730022f6b421b05cedee8fd52b1fc65a96030ad52
(1 row)

请注意,该CREATE EXTENSION函数必须以超级用户身份运行。

触发器非常简单。假设您的表格如下所示,这样的事情会做:

CREATE TABLE some_table ( key_codes text, hash bytea );

CREATE OR REPLACE FUNCTION hash_update_tg() RETURNS trigger AS $$
BEGIN
    IF tg_op = 'INSERT' OR tg_op = 'UPDATE' THEN
        NEW.hash = digest(NEW.key_codes, 'sha256');
        RETURN NEW;
    END IF;
END;
$$ LANGUAGE plpgsql;

CREATE TRIGGER some_table_hash_update 
BEFORE INSERT OR UPDATE ON some_table 
FOR EACH ROW EXECUTE PROCEDURE hash_update_tg();

用法:

regress=> INSERT INTO some_table(key_codes) VALUES ('fred');
INSERT 0 1
regress=> SELECT * FROM some_table;
 key_codes |                                hash                                
-----------+--------------------------------------------------------------------
 fred      | \xd0cfc2e5319b82cdc71a33873e826c93d7ee11363f8ac91c4fa3a2cfcd2286e5
(1 row)

您可以通过使更新触发器有条件来减少触发器执行的开销。而不是上面的CREATE TRIGGER,使用这两个:

CREATE TRIGGER some_table_hash_insert
BEFORE INSERT ON some_table 
FOR EACH ROW 
EXECUTE PROCEDURE hash_update_tg(); 

CREATE TRIGGER some_table_hash_update 
BEFORE UPDATE ON some_table 
FOR EACH ROW 
WHEN ( NEW.key_codes IS DISTINCT FROM OLD.key_codes ) 
EXECUTE PROCEDURE hash_update_tg(); 
于 2012-12-03T13:19:03.157 回答
29

从 PostgreSQL 11 开始,您可以使用内置函数来计算哈希值:

SELECT sha256('hello world!');
-- x7509e5bda0c762d2bac7f90d758b5b2263fa01ccbc542ab5e3df163be08e6ca9

db<>小提琴演示

其他二进制字符串函数

+----------------+--------------+---------------+
|   Function     | Return Type  |  Description  |
+----------------+--------------+---------------+
| sha224(bytea)  | bytea        | SHA-224 hash  |
| sha256(bytea)  | bytea        | SHA-256 hash  |
| sha384(bytea)  | bytea        | SHA-384 hash  |
| sha512(bytea)  | bytea        | SHA-512 hash  |
+----------------+--------------+---------------+

请注意,由于历史原因,函数 md5 返回文本类型的十六进制编码值,而 SHA-2 函数返回类型 bytea。使用函数 encode 和 decode 在两者之间进行转换,例如 encode(sha256('abc'), 'hex') 以获得十六进制编码的文本表示。

于 2018-10-15T14:55:13.010 回答
5

从 PostgreSQL 12 开始,您可以使用生成的列;它可能很简单:

CREATE TABLE codes (
    ...,
    key_code text,
    sha_code text GENERATED ALWAYS AS (encode(sha256(key_code::bytea), 'hex')) STORED
);

与其他方法一样,CREATE EXTENSION IF NOT EXISTS pgcrypto;如果还不是架构的一部分,您可能需要这样做。

可以像任何其他列一样选择和索引生成的列:

CREATE INDEX idx_sha_codes ON codes USING btree (sha_code);
SELECT id, sha_code FROM codes WHERE sha_code = '...';

有一些明显的限制,例如它们不能引用其他生成的列或其他表。但是,这种派生值几乎是一个完美的用例。更多信息请访问https://www.postgresql.org/docs/12/ddl-generated-columns.html

于 2020-07-16T02:42:37.260 回答