0

我有一个包含在包含大约 30,000 个子目录的目录中的数据集。这些目录中的每一个都包含一个文本文件和另一个子目录。该子目录包含一些文本文件(范围从 0 个文本文件到数百个)。我的许多同事都使用这个数据集,但是因为它需要至少 6 个小时才能将数据集从实验室中的一台计算机/硬盘传输到另一台 - 不是因为数据集的大小,而是因为繁琐它存储的格式。我想创建一些存档(例如 .tar.gz)来存储这些数据,以便它们可以在计算机之间快速传输。我想看看有没有人以前用过这样的东西,能最快地告诉我,最好的方法是什么?我在想一个 shell 脚本可能比我自己创建档案更快。

4

1 回答 1

0

建议:NFS挂载目录。然后一个 windows 盒子或一个 unix 盒子可以访问该目录。

评论:这样的目录结构对文件系统中的 inode 来说是个坏消息,而且还会增加搜索时间。

答:这适用于任何符合 POSIX 的 unix 机器,并假设您的存储库只有一个基本目录——

cd /path/to/archive; tar cvf mycharhive.tar ./archive_dir;  gzip myarchive.tar

这会创建一个相对路径的 tar 存档 - 这意味着您可以将其解压缩到低级目录,而不是脱离根目录。

于 2010-06-30T19:38:18.263 回答