7

我创建了许多个人库来帮助我进行日常编码。最佳做法是将导入放在 python 程序的开头。但是假设我导入了我的库,甚至只是从库中导入了一个函数或类。所有模块都被导入(即使这些模块在其他未使用的类或函数中使用)。我认为这会增加程序的开销?

一个例子。我有一个名为 pytools 的库,它看起来像这样

import difflib

def foo():
    # uses difflib.SequenceMatcher

def bar():
    # benign function ie
    print "Hello!"
    return True

class foobar:
    def __init__():
        print "New foobar"
    def ret_true():
        return True

函数 foo 使用 difflib。现在假设我正在编写一个需要使用 bar 和 foobar 的新程序。我可以写

import pytools
...
item = pytools.foobar()
vals = pytools.bar()

或者我可以

from pytools import foobar, bar
...
item = foobar()
vals = bar()

这两种选择是否会减少开销或排除 foo 的导入及其对 difflib 的依赖?如果 difflib 的导入在 foo 函数内部怎么办?

我遇到的问题是将简单程序转换为仅使用我的库中的一两个类或函数的可执行文件时,可执行文件最终大小为 50 mb 左右。

我已经阅读了 py2exe 的优化大小页面,可以使用它的一些建议进行优化。

http://www.py2exe.org/index.cgi/OptimizingSize

我想我真的在这里寻求最佳实践。是否有某种方法可以阻止导入依赖项位于未使用的函数或类中的库?我已经看到使用调试器执行导入语句,并且在继续之前,python 似乎只使用“def somefunction”“拾取”行。在使用函数/类之前,其余的导入是否尚未完成?这意味着将大量导入放在函数或类的开头可以减少库其余部分的开销。

4

1 回答 1

4

有效减少依赖的唯一方法是将工具箱拆分为更小的模块,并且只导入您需要的模块。

将导入放在未使用函数的开头将阻止在运行时加载这些模块,但不鼓励这样做,因为它隐藏了依赖项。此外,您的 Python 到可执行文件的转换器可能无论如何都需要包含这些模块,因为 Python 的动态特性使得无法静态确定实际调用了哪些函数。

于 2012-06-22T15:34:26.867 回答