905

据我了解,缓存是类似文件的加密文件。

我们如何处理__pycache__文件夹?是我们提供给人们的东西而不是我们的源代码吗?它只是我的输入数据吗?这个文件夹不断被创建,它是做什么用的?

4

10 回答 10

776

当您在 Python 中运行程序时,解释器首先将其编译为字节码(这过于简单化了)并将其存储在__pycache__文件夹中。如果你在那里查看,你会发现一堆文件共享.py项目文件夹中文件的名称,只有它们的扩展名是.pyc.pyo。这些分别是程序文件的字节码编译版本和优化的字节码编译版本。

作为程序员,你基本上可以忽略它......它所做的只是让你的程序启动得更快一点。当您的脚本更改时,它们将被重新编译,如果您删除文件或整个文件夹并再次运行您的程序,它们将重新出现(除非您特别禁止该行为)。

当您将代码发送给其他人时,通常的做法是删除该文件夹,但您是否这样做并不重要。当您使用版本控制 ( git) 时,此文件夹通常列在忽略文件 ( .gitignore) 中,因此不包括在内。

如果您使用的是 CPython(这是最常见的,因为它是参考实现)并且您不想要该文件夹,那么您可以通过使用 -B 标志启动解释器来抑制它,例如

python -B foo.py

如 tcaswell 所述,另一种选择是将环境变量设置PYTHONDONTWRITEBYTECODE为任何值(根据 Python 的手册页,任何“非空字符串”)。

于 2013-06-01T04:31:41.633 回答
223

__pycache__是一个包含已编译并准备执行的 Python 3 字节码的文件夹。

我不建议在开发过程中经常费力地删除这些文件或禁止创建,因为这会浪费您的时间。只需准备好递归命令(见下文)即可在需要时进行清理,因为字节码在极端情况下会变得陈旧(见注释)。

Python 程序员通常会忽略字节码。确实__pycache__,并且是在文件*.pyc中看到的常见行。.gitignore字节码不用于分发,可以使用dismodule进行反汇编。


如果您使用的是 OS X,您可以通过从项目的根文件夹运行以下命令轻松隐藏项目中的所有这些文件夹。

find . -name '__pycache__' -exec chflags hidden {} \;

替换__pycache__*.pycPython 2。

这会在所有这些目录(.pyc 文件)上设置一个标志,告诉 Finder/Textmate 2 将它们从列表中排除。重要的是字节码在那里,它只是被隐藏了。

如果您创建新模块并希望隐藏新字节码或删除隐藏的字节码文件,请重新运行该命令。


在 Windows 上,等效命令可能是(未经测试,欢迎使用批处理脚本):

dir * /s/b | findstr __pycache__ | attrib +h +s +r

这与使用右键单击 > 隐藏来浏览项目隐藏文件夹相同...


*.pyc运行单元测试是删除文件和__pycache__文件夹确实有用的一种场景(更多在评论中) 。我在我的中使用以下几行,~/.bash_profile并在需要时运行cl以进行清理。

alias cpy='find . -name "__pycache__" -delete'
alias cpc='find . -name "*.pyc"       -delete'
...
alias cl='cpy && cpc && ...'

最近还有更多

# pip install pyclean
pyclean .
于 2015-02-06T11:52:57.667 回答
65

__pycache__使用以下行时会创建一个文件夹:

import file_name

或尝试从您创建的另一个文件中获取信息。这使得第二次运行程序以打开另一个文件时速度更快一些。

于 2018-02-17T20:49:41.873 回答
36

来自 3.7+ 文档的更新答案:

为了加快加载模块,Python将每个模块的编译版本缓存在__pycache__name下 的目录module.version.pyc中,其中版本编码了编译文件的格式;它通常包含 Python 版本号。例如,在 CPython 3.3 版中,spam.py 的编译版本将被缓存为__pycache__/spam.cpython-33.pyc. 这种命名约定允许来自不同版本和不同 Python 版本的编译模块共存。

来源:https ://docs.python.org/3/tutorial/modules.html#compiled-python-files

也就是说,这个目录是由 Python 生成的,存在是为了让你的程序运行得更快。它不应该致力于源代码控制,而应该与您的本地源代码和平共处。


__pycache__是包含python自动生成的字节码缓存文件的目录,即编译后的python,或.pyc,文件。您可能想知道为什么 Python 这种“解释型”语言有任何已编译的文件。这个 SO question解决了这个问题(绝对值得阅读这个答案)。

python 文档更深入地了解它的工作原理以及它存在的原因:

  • 它是在 python 3.2 中添加的,因为现有的在同一目录中维护.pyc文件的系统会导致各种问题,例如在使用不同版本的 Python 解释器运行程序时。有关完整功能规范,请参阅PEP 3174
于 2018-01-08T02:43:52.960 回答
7

来自官方python教程模块

为了加快加载模块,Python将每个模块的编译版本缓存在__pycache__name下的目录中module.version.pyc,其中版本编码了编译文件的格式;它通常包含 Python 版本号。例如,在 CPython 3.6 版中,spam.py 的编译版本将被缓存为__pycache__/spam.cpython-36.pyc.

来自 Python doc Programming FAQs

当一个模块第一次被导入时(或者当源文件在当前编译文件创建之后发生了改变)一个包含编译代码的 .pyc 文件应该被创建在包含该文件__pycache__的目录的子目录中。.py.pyc文件将具有一个文件名,该文件名以与文件相同的名称开头,以.py. 结尾.pyc,中间组件取决于创建它的特定 python 二进制文件。

于 2019-03-12T19:53:59.787 回答
7

导入模块时,

import file_name

Python 将编译后的字节码存储在__pycache__目录中,以便将来的导入可以直接使用它,而不必再次解析和编译源代码。

它不会仅仅为了运行脚本而这样做,只有在导入文件时才会这样做。

(以前的版本用于将缓存的字节码存储为 .pyc 文件,这些文件与 .py 文件在同一目录中乱扔垃圾,但从 Python 3 开始,它们被移至子目录以使事情更整洁。)

PYTHONDONTWRITEBYTECODE ---> 如果将其设置为非空字符串,Python 将不会尝试在导入源模块时写入 .pyc 文件。这等效于指定 -B 选项。

于 2020-04-21T10:12:29.563 回答
5

当解释器编译代码时,Python 版本 2.x 将具有.pyc 。

当解释器编译代码时,Python 版本 3.x 将具有__pycache__ 。

alok@alok:~$ ls
module.py  module.pyc  __pycache__  test.py
alok@alok:~$
于 2019-12-07T03:43:13.580 回答
5

执行 python 脚本会导致字节码在内存中生成并保存到程序关闭。如果导入了模块,为了更快的可重用性,Python 将创建一个缓存 .pyc(PYC 是 'Python' 'Compiled')文件,其中缓存了正在导入的模块的字节码。想法是通过避免在重新导入时重新编译(编译一次,运行多次策略)来加速 python 模块的加载。

文件名与模块名相同。初始点之后的部分表示创建缓存的 Python 实现(可能是 CPython),后跟其版本号。

于 2019-05-28T10:13:44.487 回答
5

python解释器编译*.py脚本文件并将编译结果保存到__pycache__目录中。

再次执行项目时,如果解释器识别出 *.py 脚本未被修改,则跳过编译步骤,运行之前生成的存储在__pycache__文件夹中的 *.pyc 文件。

当项目复杂时,可以缩短项目运行前的准备时间。如果程序太小,您可以通过使用选项忽略python -B abc.pyB

于 2018-06-21T07:05:53.853 回答
4

在 3.2 及更高版本中,Python 将 .pyc 编译后的字节码文件保存在一个名为__pycache__的子目录中,该子目录位于源文件所在目录中,文件名标识创建它们的 Python 版本(例如 script.cpython-33.pyc)

于 2017-03-30T15:37:30.673 回答