726

我想知道我的 Python 应用程序的内存使用情况,特别想知道哪些代码块/部分或对象消耗了最多的内存。谷歌搜索显示一个商业版本是Python Memory Validator(仅限 Windows)。

开源的是PySizerHeapy

我没有尝试过任何人,所以我想知道哪个是最好的考虑:

  1. 提供大部分细节。

  2. 我必须对我的代码做最少的更改或不做任何更改。

4

8 回答 8

461

我的模块memory_profiler能够打印内存使用情况的逐行报告,并且可以在 Unix 和 Windows 上运行(最后一个需要 psutil)。输出不是很详细,但目的是让您大致了解代码在哪里消耗更多内存,而不是对分配的对象进行详尽的分析。

用标志装饰你的函数@profile并运行你的代码后,-m memory_profiler它将打印一个逐行报告,如下所示:

Line #    Mem usage  Increment   Line Contents
==============================================
     3                           @profile
     4      5.97 MB    0.00 MB   def my_func():
     5     13.61 MB    7.64 MB       a = [1] * (10 ** 6)
     6    166.20 MB  152.59 MB       b = [2] * (2 * 10 ** 7)
     7     13.61 MB -152.59 MB       del b
     8     13.61 MB    0.00 MB       return a
于 2012-05-14T22:51:16.357 回答
306

guppy3使用起来非常简单。在您的代码中的某个时刻,您必须编写以下内容:

from guppy import hpy
h = hpy()
print(h.heap())

这会给你一些像这样的输出:

Partition of a set of 132527 objects. Total size = 8301532 bytes.
Index  Count   %     Size   % Cumulative  % Kind (class / dict of class)
0  35144  27  2140412  26   2140412  26 str
1  38397  29  1309020  16   3449432  42 tuple
2    530   0   739856   9   4189288  50 dict (no owner)

您还可以找出引用对象的位置并获取有关它的统计信息,但不知何故,有关的文档有点稀疏。

还有一个图形浏览器,用 Tk 编写。

对于 Python 2.x,请使用Heapy

于 2008-09-21T11:45:39.977 回答
85

我推荐Dowser。它很容易设置,您需要对代码进行零更改。您可以通过简单的 Web 界面查看随时间变化的每种类型的对象计数、查看活动对象列表、查看对活动对象的引用。

# memdebug.py

import cherrypy
import dowser

def start(port):
    cherrypy.tree.mount(dowser.Root())
    cherrypy.config.update({
        'environment': 'embedded',
        'server.socket_port': port
    })
    cherrypy.server.quickstart()
    cherrypy.engine.start(blocking=False)

您导入 memdebug,然后调用 memdebug.start。就这样。

我还没有尝试过 PySizer 或 Heapy。我会感谢其他人的评论。

更新

上面的代码是 for的CherryPy 2.X,方法已经去掉了,不带flag了。所以如果你正在使用CherryPy 3.Xserver.quickstartengine.startblockingCherryPy 3.X

# memdebug.py

import cherrypy
import dowser

def start(port):
    cherrypy.tree.mount(dowser.Root())
    cherrypy.config.update({
        'environment': 'embedded',
        'server.socket_port': port
    })
    cherrypy.engine.start()
于 2008-09-21T04:50:55.013 回答
69

考虑objgraph库(有关示例用例,请参阅此博客文章)。

于 2009-10-27T19:41:40.357 回答
19

Muppy是(又一个)Python 的内存使用分析器。该工具集的重点是识别内存泄漏。

Muppy 试图帮助开发人员识别 Python 应用程序的内存泄漏。它可以在运行时跟踪内存使用情况并识别正在泄漏的对象。此外,还提供了允许定位未释放对象的来源的工具。

于 2013-03-11T14:17:42.353 回答
14

我正在为 Python 开发一个名为 memprof 的内存分析器:

http://jmdana.github.io/memprof/

它允许您在执行修饰方法期间记录和绘制变量的内存使用情况。您只需使用以下命令导入库:

from memprof import memprof

并使用以下方法装饰您的方法:

@memprof

这是一个关于情节如何的例子:

在此处输入图像描述

该项目托管在 GitHub 中:

https://github.com/jmdana/memprof

于 2013-07-03T12:12:50.307 回答
12

我发现meliae比 Heapy 或 PySizer 更实用。如果你碰巧在运行一个 wsgi webapp,那么Dozer是一个不错的 Dowser 中间件包装器

于 2011-10-25T21:31:15.557 回答
7

也可以试试pytracemalloc 项目,它提供每个 Python 行号的内存使用情况。

编辑(2014/04):它现在有一个 Qt GUI 来分析快照。

于 2013-09-04T22:56:02.990 回答