16

作为序言,我想我可能已经想出了如何让这段代码工作(基于在import 之后更改模块变量),但我的问题实际上是关于为什么会发生以下行为,所以我可以理解将来不应该做什么。

我有三个文件。第一个是 mod1.py:

# mod1.py

import mod2

var1A = None

def func1A():
    global var1
    var1 = 'A'
    mod2.func2()

def func1B():
    global var1
    print var1

if __name__ == '__main__':
    func1A()

接下来我有 mod2.py:

# mod2.py

import mod1

def func2():
    mod1.func1B()

最后我有driver.py:

# driver.py

import mod1

if __name__ == '__main__':
    mod1.func1A()

如果我执行命令python mod1.py,那么输出是None. 根据我上面引用的链接,mod1.py导入为__main__mod1.py导入自mod2.py. 因此,我创建了driver.py. 如果我执行命令python driver.py,那么我会得到预期的输出:A. 我有点看到差异,但我并没有真正看到机制或原因。这是如何以及为什么会发生的?同一个模块会存在两次似乎违反直觉。如果我执行python mod1.py,是否可以访问__main__版本中mod1.py的变量而不是导入的版本中的变量mod2.py

4

2 回答 2

25

__name__变量始终包含模块的名称,除非文件已作为脚本加载到解释器中。然后将该变量设置为字符串'__main__'

毕竟,脚本随后作为整个程序的主文件运行,其他所有内容都是由该主文件直接或间接导入的模块。通过测试__name__变量,您可以检测文件是作为模块导入还是直接运行。

在内部,模块被赋予一个命名空间字典,它作为每个模块元数据的一部分存储在sys.modules. 主文件,即执行的脚本,存储在与'__main__'.

但是,当您将文件作为模块导入时,python 首先sys.modules会查看该模块之前是否已经导入过。所以,import mod1意味着我们首先寻找sys.modules模块mod1mod1如果还没有命名空间,它将创建一个带有命名空间的新模块结构。

因此,如果您都mod1.py作为主文件运行,然后将其作为python模块导入,它将sys.modules. 一个 as '__main__',然后是'mod1'。这两个命名空间是完全独立的。您的全局var1存储在 中,sys.modules['__main__']func1B正在寻找它在哪里。sys.modules['mod1']var1None

但是当你使用python driver.py,driver.py成为'__main__'程序的主文件,并且mod1只会被导入到sys.modules['mod1']结构中一次。这一次,func1A存储var1sys.modules['mod1']结构中,这就是func1B会发现的。

于 2012-11-01T16:40:10.587 回答
1

关于可选地使用模块作为主脚本的实用解决方案 - 支持一致的交叉导入:

解决方案1:

__main__参见例如在 Python 的 pdb 模块中,它是如何通过在执行为(最后)时导入自身作为脚本运行的:

#! /usr/bin/env python
"""A Python debugger."""
# (See pdb.doc for documentation.)
import sys
import linecache

...

# When invoked as main program, invoke the debugger on a script
if __name__ == '__main__':
    import pdb
    pdb.main()

只是我建议将__main__启动重新组织到脚本的开头,如下所示:

#! /usr/bin/env python
"""A Python debugger."""
# When invoked as main program, invoke the debugger on a script
import sys
if __name__ == '__main__':        
    ##assert os.path.splitext(os.path.basename(__file__))[0] == 'pdb'
    import pdb
    pdb.main()
    sys.exit(0)

import linecache
...

这样,模块主体就不会执行两次——这是“昂贵的”、不可取的并且有时是关键的。

解决方案2:

在极少数情况下,最好将实际脚本模块__main__直接公开为实际模块别名 ( mod1):

# mod1.py    
import mod2

...

if __name__ == '__main__':
    # use main script directly as cross-importable module 
    _mod = sys.modules['mod1'] = sys.modules[__name__]
    ##_modname = os.path.splitext(os.path.basename(os.path.realpath(__file__)))[0]
    ##_mod = sys.modules[_modname] = sys.modules[__name__]
    func1A()

已知缺点:

  • reload(_mod)失败
  • 腌制的类需要额外的映射来解酸(find_global..)
于 2017-04-27T22:02:39.770 回答