有没有办法将__init__.py
多个文件组织成一个模块?
原因:模块比包更容易使用,因为它们没有那么多层的命名空间。
通常它会打包,我明白了。问题出在一个包上,“import thepackage”给了我一个空的命名空间。然后,用户必须要么使用“from thepackage import *”(不赞成),要么确切地知道其中包含什么并手动将其拉出到可用的命名空间中。
我想要的是用户执行“导入包”并拥有看起来像这样的漂亮干净的命名空间,公开与项目相关的函数和类以供使用。
current_module
\
doit_tools/
\
- (class) _hidden_resource_pool
- (class) JobInfo
- (class) CachedLookup
- (class) ThreadedWorker
- (Fn) util_a
- (Fn) util_b
- (Fn) gather_stuff
- (Fn) analyze_stuff
维护者的工作是避免在不同的文件中定义相同的名称,当项目像我这样小时,这应该很容易。
如果人们可以做from doit_stuff import JobInfo
并让它检索类,而不是包含该类的模块,那也很好。
如果我的所有代码都在一个巨大的文件中,这很容易,但我喜欢在事情开始变大时进行组织。我在磁盘上的内容看起来像这样:
place_in_my_python_path/
doit_tools/
__init__.py
JobInfo.py
- class JobInfo:
NetworkAccessors.py
- class _hidden_resource_pool:
- class CachedLookup:
- class ThreadedWorker:
utility_functions.py
- def util_a()
- def util_b()
data_functions.py
- def gather_stuff()
- def analyze_stuff()
我只将它们分开,所以我的文件不会很大且无法导航。它们都是相关的,尽管有人(可能是我)可能想自己使用这些类而不导入所有内容。
我在各个线程中阅读了许多建议,以下是我可以找到的有关如何执行此操作的每个建议的情况:
如果我不使用__init__.py
,我将无法导入任何内容,因为 Python 不会从 sys.path 进入文件夹。
如果我使用空白__init__.py
,当我import doit_tools
是一个空的命名空间时,其中没有任何内容。我的文件都没有导入,这使得它更难使用。
如果我在 中列出子模块__all__
,我可以使用(皱眉?)from thing import *
语法,但我所有的类都在不必要的命名空间障碍后面。用户必须(1)知道他们应该使用from x import *
而不是import x
,(2)手动重新洗牌,直到他们可以合理地遵守线宽样式约束。
如果我向 中添加from thatfile import X
语句__init__.py
,我会更接近,但我有命名空间冲突(?)和额外的命名空间,用于我不想在那里的东西。在下面的示例中,您将看到:
- JobInfo 类覆盖了名为 JobInfo 的模块对象,因为它们的名称相同。Python 可以通过某种方式解决这个问题,因为 JobInfo 是
<class 'doit_tools.JobInfo.JobInfo'>
. (doit_tools.JobInfo 是一个类,但 doit_tools.JobInfo.JobInfo 是同一个类......这很纠结,看起来很糟糕,但似乎没有破坏任何东西。) - 每个文件名都进入了 doit_tools 命名空间,如果有人正在查看模块的内容,则查看起来会更加混乱。我希望 doit_tools.utility_functions.py 保存一些代码,而不是定义新的命名空间。
.
current_module
\
doit_tools/
\
- (module) JobInfo
\
- (class) JobInfo
- (class) JobInfo
- (module) NetworkAccessors
\
- (class) CachedLookup
- (class) ThreadedWorker
- (class) CachedLookup
- (class) ThreadedWorker
- (module) utility_functions
\
- (Fn) util_a
- (Fn) util_b
- (Fn) util_a
- (Fn) util_b
- (module) data_functions
\
- (Fn) gather_stuff
- (Fn) analyze_stuff
- (Fn) gather_stuff
- (Fn) analyze_stuff
同样,仅导入数据抽象类的人在执行“from doit_tools import JobInfo”时会得到与他们预期不同的东西:
current_namespace
\
JobInfo (module)
\
-JobInfo (class)
instead of:
current_namespace
\
- JobInfo (class)
那么,这只是组织 Python 代码的错误方式吗?如果不是,那么将相关代码拆分但仍以类似模块的方式收集它的正确方法是什么?
也许最好的情况是执行'from doit_tools import JobInfo'对于使用该包的人来说有点混乱?
也许是一个名为'api'的python文件,以便使用该代码的人执行以下操作?:
import doit_tools.api
from doit_tools.api import JobInfo
============================================
回应评论的例子:
在 python 路径中的文件夹 'foo' 中获取以下包内容。
foo/__init__.py
__all__ = ['doit','dataholder','getSomeStuff','hold_more_data','SpecialCase']
from another_class import doit
from another_class import dataholder
from descriptive_name import getSomeStuff
from descriptive_name import hold_more_data
from specialcase import SpecialCase
foo/specialcase.py
class SpecialCase:
pass
foo/more.py
def getSomeStuff():
pass
class hold_more_data(object):
pass
foo/stuff.py
def doit():
print "I'm a function."
class dataholder(object):
pass
做这个:
>>> import foo
>>> for thing in dir(foo): print thing
...
SpecialCase
__builtins__
__doc__
__file__
__name__
__package__
__path__
another_class
dataholder
descriptive_name
doit
getSomeStuff
hold_more_data
specialcase
another_class
并且descriptive_name
是否有杂乱无章的东西,并且在它们的名称空间下还有额外的 doit() 副本。
如果我在名为 Data.py 的文件中有一个名为 Data 的类,当我执行“从数据导入数据”时,我会遇到命名空间冲突,因为 Data 是当前命名空间中的一个类,它位于模块 Data 中,不知何故也在当前命名空间。(但 Python 似乎能够处理这个问题。)