繁体   English   中英

导入模块:__main__ vs作为模块导入

[英]Importing modules: __main__ vs import as module

作为序言,我想我可能已经弄清楚了如何使此代码正常工作(基于import之后更改模块变量 ),但是我的问题确实是关于为什么会发生以下行为,以便我将来可以做什么。

我有三个文件。 第一个是mod1.py:

# mod1.py

import mod2

var1A = None

def func1A():
    global var1
    var1 = 'A'
    mod2.func2()

def func1B():
    global var1
    print var1

if __name__ == '__main__':
    func1A()

接下来我有mod2.py:

# mod2.py

import mod1

def func2():
    mod1.func1B()

最后我有driver.py:

# driver.py

import mod1

if __name__ == '__main__':
    mod1.func1A()

如果我执行命令python mod1.py则输出为None 根据我上面提到的链路上,似乎有一些区分mod1.py为被进口__main__mod1.py正在从进口mod2.py 因此,我创建了driver.py 如果执行命令python driver.py则会得到预期的输出: A 我看到了一些区别,但是我并没有真正看到它的机制或原因。 这是怎么发生的以及为什么发生的? 似乎同一模块将存在两次是违反直觉的。 如果我执行python mod1.py ,是否可以访问mod1.py__main__版本中的变量,而不是mod2.py导入的版本中的变量?

__name__变量始终包含模块的名称, 除非文件已作为脚本加载到解释器中。 然后将该变量设置为字符串'__main__'

毕竟,脚本随后将作为整个程序的主文件运行,其他所有文件都是该主文件直接或间接导入的模块。 通过测试__name__变量,您可以因此检测文件是作为模块导入的还是直接运行的。

在内部,为模块提供了一个命名空间字典,该字典作为每个模块的元数据的一部分存储在sys.modules 主文件(已执行的脚本)以与'__main__'相同的结构存储。

但是,当您将文件导入为模块时,python首先在sys.modules查找该模块是否已经导入。 因此, import mod1意味着我们首先在sys.modules查找mod1模块。 如果还没有mod1它将创建一个带有名称空间的新模块结构。

因此,如果您都将mod1.py作为主文件运行, 然后将其作为python模块导入,则它将在sys.modules获得两个命名空间条目。 一个是'__main__' ,然后是'mod1' 这两个名称空间是完全分开的。 您的全局var1存储在sys.modules['__main__'] ,但是func1Bsys.modules['mod1']查找var1 ,其中为None

但是,当您使用python driver.pydriver.py成为程序的'__main__'主文件,并且mod1将仅一次导入sys.modules['mod1']结构中。 这次, func1Avar1存储在sys.modules['mod1']结构中,这就是func1B会发现的。

关于将模块可选地用作主脚本的实用解决方案-支持一致的交叉导入:

解决方案1:

参见例如在Python的pdb模块中,如何在以__main__ (最后)执行时通过导入自身将其作为脚本运行:

#! /usr/bin/env python
"""A Python debugger."""
# (See pdb.doc for documentation.)
import sys
import linecache

...

# When invoked as main program, invoke the debugger on a script
if __name__ == '__main__':
    import pdb
    pdb.main()

我只是建议将__main__启动重新组织为脚本的开头,如下所示:

#! /usr/bin/env python
"""A Python debugger."""
# When invoked as main program, invoke the debugger on a script
import sys
if __name__ == '__main__':        
    ##assert os.path.splitext(os.path.basename(__file__))[0] == 'pdb'
    import pdb
    pdb.main()
    sys.exit(0)

import linecache
...

这样,模块主体不会执行两次-这是“昂贵的”,不希望的,有时甚至很关键。

解决方案2:

在极少数情况下,最好甚至将实际脚本模块__main__公开为实际模块别名( mod1 ):

# mod1.py    
import mod2

...

if __name__ == '__main__':
    # use main script directly as cross-importable module 
    _mod = sys.modules['mod1'] = sys.modules[__name__]
    ##_modname = os.path.splitext(os.path.basename(os.path.realpath(__file__)))[0]
    ##_mod = sys.modules[_modname] = sys.modules[__name__]
    func1A()

已知缺点:

  • reload(_mod)失败
  • 腌制的类将需要额外的映射才能进行find_globalfind_global ..)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM