6

我们有一个 postgresql 数据库,它每晚使用以下命令从 cron 作业备份:

su postgres -c "pg_dump our_database | gzip > /home/smb/shared/database_backup.bak.gz"

最近我们有一个磁盘故障,从几个坏扇区开始,在那段时间 pg_dump 退出并出现以下错误

pg_dump: SQL command failed
pg_dump: Error message from server: ERROR: catalog is missing 17 attribute(s) from relid 20158
pd_dump: The command was: LOCK TABLE public.obvez IN ACCESS SHARE MODE

现在,由于它在 cron 作业中,没有人注意到错误消息,备份被中断但它不是零大小,一切似乎都很好,直到最终磁盘故障,当我们意识到我们没有备份时,错误才被注意到。

我们设法从较旧的备份中恢复数据,但现在我想知道检查 pg_dump 是否成功完成工作的正确方法是什么?

4

1 回答 1

7

我将结果写入日志文件,并在 cronjob 结束时将日志文件的内容发送到我的电子邮件地址。这样,我会知道什么时候出了问题。

su postgres "pg_dump our_database 2>> $LOG_FILE | gzip > /home/smb/shared/database_backup.bak.gz"
cat $LOG_FILE | mailx $MAINTAINERS -s "Postgresql backup"

ADDENDUM:如果您只想在出现问题时发送电子邮件,您可以检查 pg_dump 的返回码:

LOG_FILE=/tmp/pgdump.err

if ! pg_dump -U backupuser "our_database" 2> $LOG_FILE 
then 
    cat $LOG_FILE | mailx 'youremailaddress' -s "Postgresql backup failure!"
fi
于 2011-06-14T09:09:30.627 回答