6

我正在使用 shutil.disk_usage() 函数来查找特定路径的当前磁盘使用情况(可用数量、已使用等)。据我所知,这是 os.statvfs() 调用的包装器。与 Linux 中“du”的输出相比,我发现它没有给出我期望的答案。

出于公司隐私的原因,我遮盖了下面的一些路径,但输出和代码在其他方面没有被篡改。我正在使用 Python 3.3.2 64 位版本。

#!/apps/python/3.3.2_64bit/bin/python3

# test of shutils.diskusage module
import shutil

BytesPerGB = 1024 * 1024 * 1024

(total, used, free) = shutil.disk_usage("/data/foo/")
print ("Total: %.2fGB" % (float(total)/BytesPerGB))
print ("Used:  %.2fGB" % (float(used)/BytesPerGB))

(total1, used1, free1) = shutil.disk_usage("/data/foo/utils/")
print ("Total: %.2fGB" % (float(total1)/BytesPerGB))
print ("Used:  %.2fGB" % (float(used1)/BytesPerGB))

哪个输出:

/data/foo/drivecode/me % disk_usage_test.py
Total: 609.60GB
Used:  291.58GB
Total: 609.60GB
Used:  291.58GB

如您所见,主要问题是我希望“已使用”的第二个数量要小得多,因为它是第一个目录的子集。

/data/foo/drivecode/me % du -sh /data/foo/utils
2.0G    /data/foo/utils

尽管我相信“du”,但我很难相信 Python 模块也不正确。因此,问题可能只是我对 Linux 文件系统的理解。:)

我编写了一个模块(主要基于 SO 中某人的代码),它递归地获取我一直使用的 disk_usage。它似乎与“du”输出相匹配,但比 shutil.disk_usage() 函数慢得多,所以我希望我能做到这一点。

提前非常感谢。

4

3 回答 3

7

问题是shutil使用statvfs下面的系统调用来确定使用的空间。据我所知,这个系统调用没有文件路径粒度,只有文件系统粒度。这意味着您提供的路径仅有助于识别您要查询的文件系统,而不是路径。

换句话说,你给了它路径/data/foo/utils,然后它确定哪个文件系统支持这个文件路径。然后它查询文件系统used当您考虑如何在shutil中定义参数时,这一点变得很明显:

used = (st.f_blocks - st.f_bfree) * st.f_frsize

在哪里:

fsblkcnt_t     f_blocks;   /* size of fs in f_frsize units */
fsblkcnt_t     f_bfree;    /* # free blocks */
unsigned long  f_frsize;   /* fragment size */

这就是为什么它为您提供整个文件系统上使用的总空间。

事实上,在我看来,du命令本身也遍历文件结构并累加文件大小。这是 GNU coreutilsdu命令的源代码

于 2013-10-08T00:00:41.517 回答
5

shutil.disk_usage返回磁盘使用情况(即支持路径的安装点),而不是该路径下的实际文件使用情况。它相当于运行df /path/to/mount而不是du /path/to/files。请注意,对于这两个目录,您的用法完全相同。

来自文档:“以命名元组的形式返回有关给定路径的磁盘使用统计信息,其属性为 total、used 和 free,它们是总、已用和可用空间的数量,以字节为单位。”

于 2013-10-08T00:08:29.577 回答
2

对于 2013 年之后偶然发现此问题的任何人的更新:


根据您的 Python 版本和操作系统,shutil.disk_usage可能支持path变量的文件和目录。这是细分:

视窗:

  • 3.3 - 3.5:仅支持挂载点/文件系统
  • 3.6 - 3.7:目录支持
  • 3.8+:文件和目录支持

Unix:

  • 3.3 - 3.5:仅支持挂载点/文件系统
  • 3.6+:文件和目录支持
于 2020-08-21T13:31:40.260 回答