我想使用 PostgreSQL 的本机范围分区自动化分区 Zabbix 3.4 数据库的过程。
编写 SQL 函数来执行以下操作或使用 shell/python 脚本会更明智吗?
- 确保在需要之前至少创建一个分区。
- 删除任何超过x周/月的分区;
history
7天和trends
1年
我想使用 PostgreSQL 的本机范围分区自动化分区 Zabbix 3.4 数据库的过程。
编写 SQL 函数来执行以下操作或使用 shell/python 脚本会更明智吗?
history
7天和trends
1年以下是我提出的从没有分区的 PSQL 9.4 填充数据库过渡到 PSQL 10 本机范围分区的解决方案。
A. 创建一个 Zabbix 空 PSQL 10 数据库。
确保首先创建一个空的 Zabbix PSQL 10 DB。
# su postgres
postgres@<>:~$ createuser -P -s -e zabbix
postgres@<>:~$ psql
postgres# create database zabbix;
postgres# grant all privileges on database zabbix to zabbix;
clock
B. 在列上创建表和本地范围分区
在 Zabbix DB 中创建表并为时钟列实现原生范围分区。下面是一个手动 SQL 脚本的示例,它可以用于history
表格。history
对要通过范围分区的所有表执行此操作。
zabbix=# CREATE TABLE public.history
(
itemid bigint NOT NULL,
clock integer NOT NULL DEFAULT 0,
value numeric(20,0) NOT NULL DEFAULT (0)::numeric,
ns integer NOT NULL DEFAULT 0
) PARTITION BY RANGE (clock);
zabbix=# CREATE TABLE public.history_old PARTITION OF public.history
FOR VALUES FROM (MINVALUE) TO (1522540800);
zabbix=# CREATE TABLE public.history_y2018m04 PARTITION OF public.history
FOR VALUES FROM (1522540800) TO (1525132800);
zabbix=# CREATE TABLE public.history_y2018m05 PARTITION OF public.history
FOR VALUES FROM (1525132800) TO (1527811200);
zabbix=# CREATE INDEX ON public.history_old USING btree (itemid, clock);
zabbix=# CREATE INDEX ON public.history_y2018m04 USING btree (itemid, clock);
zabbix=# CREATE INDEX ON public.history_y2018m05 USING btree (itemid, clock);
C. 自动化!
我使用了一个 shell 脚本,因为它是在 PSQL 10 中处理创建新分区的最简单的方法之一。确保您始终至少比需要的分区早一个分区。
让我们调用脚本auto_history_tables_monthly.sh
。
在运行 PSQL 10 的 Debian 8 Flavor OS 上,确保脚本位于/usr/local/bin
具有正确权限(chown postgres:postgres /usr/local/bin/auto_history_tables_monthly.sh
)的某个目录(我使用过)中,并使其可执行(chmod u+x /usr/local/bin/auto_history_tables_monthly.sh
作为postgres
用户)。
使用以下命令为用户创建一个 cron 作业 ( crontab -e
) :postgres
0 0 1 * * /usr/local/bin/auto_history_tables_monthly.sh | psql -d zabbix
这将在每个月的第一天运行 shell 脚本。
下面是脚本。它使用date
命令来利用 UTC 纪元值。它提前一个月创建一个表并删除两个月前的分区。这似乎与history
根据我的需要定制的 31 天保留结合起来效果很好。确保此用例的 PSQL 10 数据库处于 UTC 时间。
#!/bin/bash
month_diff () {
year=$1
month=$2
delta_month=$3
x=$((12*$year+10#$month-1))
x=$((x+$delta_month))
ry=$((x/12))
rm=$(((x % 12)+1))
printf "%02d %02d\n" $ry $rm
}
month_start () {
year=$1
month=$2
date '+%s' -d "$year-$month-01 00:00:00" -u
}
month_end () {
year=$1
month=$2
month_start $(month_diff $year $month 1)
}
# Year using date
current_year=$(date +%Y)
current_month=$(date +%m)
# Math
next_date=$(month_diff $current_year $current_month 1)
next_year=$(echo $next_date|sed 's/ .*//')
next_month=$(echo $next_date|sed 's/.* //')
start=$(month_start $next_date)
end=$(month_end $next_date)
#next_month_table="public.history_y${next_year}m${next_month}"
# Create next month table for history, history_uint, history_str, history_log, history_text
sql="
CREATE TABLE IF NOT EXISTS public.history_y${next_year}m${next_month} PARTITION OF public.history
FOR VALUES FROM ($start) TO ($end);
\nCREATE TABLE IF NOT EXISTS public.history_uint_y${next_year}m${next_month} PARTITION OF public.history_uint
FOR VALUES FROM ($start) TO ($end);
\nCREATE TABLE IF NOT EXISTS public.history_str_y${next_year}m${next_month} PARTITION OF public.history_str
FOR VALUES FROM ($start) TO ($end);
\nCREATE TABLE IF NOT EXISTS public.history_log_y${next_year}m${next_month} PARTITION OF public.history_log
FOR VALUES FROM ($start) TO ($end);
\nCREATE TABLE IF NOT EXISTS public.history_text_y${next_year}m${next_month} PARTITION OF public.history_text
FOR VALUES FROM ($start) TO ($end);
\nCREATE INDEX on public.history_y${next_year}m${next_month} USING btree (itemid, clock);
\nCREATE INDEX on public.history_uint_y${next_year}m${next_month} USING btree (itemid, clock);
\nCREATE INDEX on public.history_str_y${next_year}m${next_month} USING btree (itemid, clock);
\nCREATE INDEX on public.history_log_y${next_year}m${next_month} USING btree (itemid, clock);
\nCREATE INDEX on public.history_text_y${next_year}m${next_month} USING btree (itemid, clock);
"
echo -e $sql
# Math
prev_date=$(month_diff $current_year $current_month -2)
prev_year=$(echo $prev_date|sed 's/ .*//')
prev_month=$(echo $prev_date|sed 's/.* //')
# Drop last month table for history, history_uint, history_str, history_log, history_text
sql="
DROP TABLE public.history_y${prev_year}m${prev_month};
\nDROP TABLE public.history_uint_y${prev_year}m${prev_month};
\nDROP TABLE public.history_str_y${prev_year}m${prev_month};
\nDROP TABLE public.history_log_y${prev_year}m${prev_month};
\nDROP TABLE public.history_text_y${prev_year}m${prev_month};
"
echo -e $sql
D. 然后从旧数据库里面dump数据。我用过pg_dump/pg_restore
。
我确信那里有更复杂的解决方案,但我发现这对于使用 PostgreSQL 10 Native Range Partitioning 功能对 Zabbix 数据库进行自动分区的需求来说是最简单的。
如果您需要更多详细信息,请告诉我。
我已经写了关于使用 PostgreSQL 版本 11 和pgpartman作为 Zabbix 本地表分区机制的详细说明(撰写本文时版本 3.4)。