3

我正在编写一个界面来帮助我分析 python 脚本。我从profile.py 源代码中借用代码来执行 python 脚本。我意识到,当我连续两次分析相同的代码时,它第二次返回给我不同数量的函数调用。例如,在 上执行以下代码myscript.py

from cProfile import Profile
import sys
import os.path

for i in range(3):
    prof = Profile()

    progname = 'myscript.py'
    sys.path.insert(0, os.path.dirname(progname))
    with open(progname, 'rb') as fp:
        code = compile(fp.read(), progname, 'exec')
    globs = {
            '__file__': progname,
            '__name__': '__main__',
            '__package__': None,
            '__cached__': None,
            }
    prof.runctx(code, globs, None)
    prof.create_stats()
    print(len(prof.stats))

给我

511
30
30

作为输出。为什么第二次调用函数的数量变少了?哪个数字是正确的数字?我该怎么做才能得到相同的结果?


myscript.py好像:

import numpy
import numpy.linalg

if __name__ == '__main__':

    r = numpy.random.rand(1000, 1000)
    numpy.linalg.inv(r)
4

1 回答 1

1

函数调用计数不同的原因似乎是因为myscript.py我第二次运行代码时导入的模块没有再次导入。

获得一致结果的第一种方法是myscript.py在执行分析之前导入。但是,这意味着如果我导入的模块在导入时执行某些任务,则不会对其进行分析。

prof = Profile()

progname = 'myscript.py'
sys.path.insert(0, os.path.dirname(progname))
modname, _ = os.path.splitext(os.path.basename(progname))
__import__(modname, globals(), locals(), [], 0)
with open(progname, 'rb') as fp:
    code = compile(fp.read(), progname, 'exec')
globs = {
        '__file__': progname,
        '__name__': '__main__',
        '__package__': None,
        '__cached__': None,
        }
prof.runctx(code, globs, None)
prof.create_stats()
print(len(prof.stats))

我发现的第二种方法是删除执行脚本时注册的所有模块。好处是,如果我在 GUI 运行时修改源代码,它将重新加载所做的更改。我现在的缺点是一些 atexit 注册的处理程序现在崩溃,因为之前删除了所需的模块:

prof = Profile()

progname = 'myscript.py'
sys.path.insert(0, os.path.dirname(progname))
with open(progname, 'rb') as fp:
    code = compile(fp.read(), progname, 'exec')
globs = {
        '__file__': progname,
        '__name__': '__main__',
        '__package__': None,
        '__cached__': None,
        }
modules = sys.modules.copy()
prof.runctx(code, globs, None)
newmodes = [modname for modname in sys.modules if modname not in modules]
for modname in newmodes:
    del sys.modules[modname]
prof.create_stats()
print(len(prof.stats))

最后,我发现最好的方法是在单独的进程中执行分析:

import concurrent.futures
import marshal
from cProfile import Profile
from pstats import Stats
import sys

progname = 'myscript.py'
with concurrent.futures.ProcessPoolExecutor() as executor:
    future = executor.submit(_run, progname)
    stats = Stats()
    stats.stats = marshal.loads(future.result())
    stats.get_top_level_stats()

def _run(progname):
    sys.path.insert(0, os.path.dirname(progname))

    with open(progname, 'rb') as fp:
        code = compile(fp.read(), progname, 'exec')
    globs = {
        '__file__': progname,
        '__name__': '__main__',
        '__package__': None,
    }
    prof = Profile()
    prof.runctx(code, globs, None)
    prof.create_stats()
    return marshal.dumps(prof.stats)
于 2013-04-16T16:49:40.727 回答