1

sysadmin1138Martin报告了在块设备(分区)上工作rsync 的替代品。它基于 perl,但我想存储双向差异。

它将块设备中的更改应用于预先存在的过时备份映像。这是第二个最好的方法,在我没有使用的lvmsync之后,因为我的块设备不在 lvm 中。

但我也想单独收集更改,以便能够重新生成以前的备份映像(例如,恢复已删除的文件)。

当 rsync 替换运行时,以下代码确实收集了这些更改:

patch=diff.`date +'%Y%m%d.%H%M%S.%N'`.gz
ssh $username@$backupnas "perl -'MDigest::MD5 md5' -ne   "\
"        'BEGIN{\$/=\1024};print md5(\$_)' $remotepartition        "\
" | gzip -c                                              "\
|gunzip -c|LANG= tee >(wc -c|LANG= sed '1s%^%number of 64 bytes blocs: %' >&2) \
|LANG= perl -'MDigest::MD5 md5' -e 'open DISK,"'"<$partition"'" or die $!; '\
'         while( read DISK,$read,1024)                                     '\
'         {                                                                '\
'           read STDIN,$md,16;                                             '\
'           if($md eq md5($read)) {print "s"} else {print "c" . $read }    '\
'         }                                                                '\
| gzip -c                                                                       \
|ssh $username@$backupnas "touch $remotepartition;LANG= tee -a $patch|gunzip -c"\
"     |perl -e 'open REVP,\"| gzip -c > rev.$patch\";                          "\
"         open PREVIOUS,\"<$remotepartition\";                                 "\
'         $rev = "PREVIOUS met EOF if length<1024."; $rev=$rev.$rev;           '\
'         $rev=$rev.$rev.$rev.$rev; $rev=$rev.$rev.$rev.$rev;                  '\
'         while(read STDIN,$read,1)                                            '\
'         {                                                                    '\
'           if ($read eq "s")                                                  '\
'           {                                                                  '\
'             if (length($rev) eq 1024) { print REVP "s" } ;                   '\
'             $s++                                                             '\
'           } else {                                                           '\
'             if ($s) { seek STDOUT,$s*1024,1; seek PREVIOUS,$s*1024,1; $s=0}; '\
'             if (read PREVIOUS,$rev,1024) { print REVP "c".$rev };            '\
'             read STDIN,$buf,1024;                                            '\
'             print $buf                                                       '\
'           }                                                                  '\
"         }' 1<> $remotepartition                                              "

$rev被初始化为长度为 1024 的标量字符串(我不知道如何使它变得更好)。

没有格式化和更多or die,这是:

patch=essai_delta.`date +'%Y%m%d.%H%M%S.%N'`.gz
ssh username@backupnas "perl -'MDigest::MD5 md5' -ne 'BEGIN{\$/=\1024};print md5(\$_)' essai_backup | gzip -c" | \
gunzip -c | LANG= tee >(wc -c|LANG= sed '1s%^%bin/backup_essai: number of 64 bytes blocs treated : %' >&2) | \
LANG= perl -'MDigest::MD5 md5' -e 'open DISK,"</data/data/com.spartacusrex.spartacuside/files/essai" or die $!; while( read DISK,$read,1024) { read STDIN,$md,16; if($md eq md5($read)) {print "s"} else {print "c" . $read } }' /data/data/com.spartacusrex.spartacuside/files/essai | \
gzip -c | \
ssh username@backupnas "LANG= tee -a $patch | gunzip -c | perl -e 'open REVP,\"| gzip -c > rev.$patch\" or die \$!; open READ,\"<essai_backup\" or die \$!; \$rev = \"if length<1024, EOF met in READ.\"; \$rev=\$rev.\$rev.\$rev.\$rev; \$rev=\$rev.\$rev.\$rev.\$rev; \$rev=\$rev.\$rev; while(read STDIN,\$read,1) { if (\$read eq \"s\") {if (length(\$rev) eq 1024) { print REVP \"s\" or die \$! } ; \$s++} else { if (\$s) { seek STDOUT,\$s*1024,1 or die \$!; seek READ,\$s*1024,1 or die \$!; \$s=0}; if (read READ,\$rev,1024) { print REVP \"c\".\$rev or die \$! } else { print STDERR \$!}; read STDIN,\$buf,1024 or die \$!; print \$buf  or die \$!} }' 1<> essai_backup"

要应用前向或后向差异,我可以使用:

ssh username@backup_nas "LANG= cat diff_delta.20141202.110302.0935 | gunzip -c | perl -ne 'BEGIN{\$/=\1} if (\$_ eq\"s\") {\$s++} else {if (\$s) { seek STDOUT,\$s*1024,1; \$s=0}; read STDIN,\$buf,1024; print \$buf}' 1<> image.file"

所以我成功地回答了这篇文章的第一个版本。这是在 200k 的示例上进行了一些修改的测试。

我对此代码有具体问题。

为什么使用原始示例read ARGV,这是不好的做法吗?

我放了很多or die $!,这是明智的还是只是破坏了可读性?

PREVIOUS并且STDOUT同一个文件是否打开了两次(以避免seek STDOUT,-1024,1),这是否被认为是好的做法?

[从programmers.so手动迁移的问题]

4

1 回答 1

2

为什么使用的原始示例读取 ARGV,这是不好的做法吗?

这是一个宗教问题。对于像这样的单行 SSH hack,如果您和可能维护它们的人非常擅长 perl 习惯用法,那或多或少都很好。但普遍的看法是,新的 perl 代码应该use strict;并采用更直观的约定。事实上,你不得不询问 bareARGV并被引用到一篇晦涩的 perlmonk 文章,这正是原因所在。我会寻找机会将编写良好、可读的脚本分发到目标机器上的标准位置,然后使用简单的ssh 命令远程运行它们。另一方面,上述方式非常适合工作保障。

我放了很多或死了$!,这是明智的还是只是破坏了可读性?

知道脚本为什么会死掉而不是获取晦涩的默认错误跟踪总是很方便的。可读性问题只是您正在使用这种将相当大的脚本放入 ssh 命令的破坏技术。如上所述,如果您为自己设置了一个更健全的环境,那么添加or die $!根本不会损害可读性。它将通过显示您预期可能发生错误的位置来增强它。

PREVIOUS 和 STDOUT 是打开两次的同一个文件(以避免寻找 STDOUT,-1024,1),这是否被认为是好的做法?

如果操作系统允许,在同一个线程中打开同一个文件上的两个描述符并不是一个坏习惯,大多数人都会这样做。它有点晦涩,所以需要评论。如果您避免使用内联脚本,这是您可以做的另一件事。

真正奇怪的做法是$rev通过重复连接将缓冲区构建为字符串以获得 1024 个字符的方式。这是不必要的。您可以说$rev = '';,字符串的长度将自动扩展为输入大小read。如果你真的想预先分配,就说$rev = '-' x 1024;.

添加

我刚刚了解了bash. 它printf带有%q格式说明符将为bash任何字符串添加转义。有了这个,您可以编写无转义bash和/或perl代码,然后说

ssh $username@$backupnas "$(printf "%q" $(cat script.bash))"
于 2014-04-09T01:02:09.133 回答