10

我有一个在 uwsgi 下运行的 django 网络服务器,它似乎泄漏了内存。

具体来说,进程的 RSS 缓慢增长,直到最终我不得不重新启动它。

我知道其他类似的问题,但是到目前为止发现的所有解决方案/结论似乎都不适用于这种情况(我可以找到)。

到目前为止,我已经使用meliaeHeapypymplerobjgraph来检查 python 堆,它们都报告了同样的事情:一个正常的堆使用大约 40MB 的内存(预期),随着时间的推移几乎没有变化(根据需要)。

不幸的是,这与进程 RSS 完全不一致,RSS 将愉快地增长到 400MB+,而不会反映在 python 堆大小中。

一些示例输出来说明我的观点 -

Pympler 输出比较 python 堆/对象内存与进程 RSS:

Memory snapshot:
                                        types |   # objects |   total size
============================================= | =========== | ============
                                         dict |       20868 |     19852512
                                          str |      118598 |     11735239
                                      unicode |       19038 |     10200248
                                        tuple |       58718 |      5032528
                                         type |        1903 |      1720312
                                         code |       13225 |      1587000
                                         list |       11393 |      1289704
                            datetime.datetime |        6953 |       333744
                                          int |       12615 |       302760
  <class 'django.utils.safestring.SafeUnicode |          18 |       258844
                                      weakref |        2908 |       255904
     <class 'django.db.models.base.ModelState |        3172 |       203008
                   builtin_function_or_method |        2612 |       188064
                       function (__wrapper__) |        1469 |       176280
                                         cell |        2997 |       167832
                            getset_descriptor |        2106 |       151632
                           wrapper_descriptor |        1831 |       146480
                                          set |         226 |       143056
                                      StgDict |         217 |       138328
---------------------------
Total object memory: 56189 kB
Total process usage:
 - Peak virtual memory size: 549016 kB
 - Virtual memory size: 549012 kB
 - Locked memory size: 0 kB
 - Peak resident set size: 258876 kB
 - Resident set size: 258868 kB
 - Size of data segment: 243124 kB
 - Size of stack segment: 324 kB
 - Size of code segment: 396 kB
 - Shared library code size: 57576 kB
 - Page table entries size: 1028 kB
---------------------------

显示类似内容的大量输出

Memory snapshot:
Partition of a set of 289509 objects. Total size = 44189136 bytes.
 Index  Count   %     Size   % Cumulative  % Kind (class / dict of class)
     0 128384  44 12557528  28  12557528  28 str
     1  61545  21  5238528  12  17796056  40 tuple
     2   5947   2  3455896   8  21251952  48 unicode
     3   3618   1  3033264   7  24285216  55 dict (no owner)
     4    990   0  2570448   6  26855664  61 dict of module
     5   2165   1  1951496   4  28807160  65 type
     6  16067   6  1928040   4  30735200  70 function
     7   2163   1  1764168   4  32499368  74 dict of type
     8  14290   5  1714800   4  34214168  77 types.CodeType
     9  10294   4  1542960   3  35757128  81 list
<1046 more rows. Type e.g. '_.more' to view.>
---------------------------
Total process usage:
 - Peak virtual memory size: 503132 kB
 - Virtual memory size: 503128 kB
 - Locked memory size: 0 kB
 - Peak resident set size: 208580 kB
 - Resident set size: 208576 kB
 - Size of data segment: 192668 kB
 - Size of stack segment: 324 kB
 - Size of code segment: 396 kB
 - Shared library code size: 57740 kB
 - Page table entries size: 940 kB
---------------------------

请注意,在这两种情况下,报告的堆大小为 40-50MB,而进程 RSS 为 200MB+。

我还使用了 objgraph 的get_leaking_objects()来尝试查看 C 扩展是否进行了错误的引用计数,但是不可 gc'able 对象的数量不会随着时间的推移而显着增长。

有没有人对如何进行调试有任何见解?在这一点上,我假设是以下两种情况之一:

  • 我有一个 C 扩展在内部泄漏内存
  • uwsgi 本身正在泄漏内存(尽管我在网上找不到其他证据)

值得一提的是,我在任何类型的开发环境中都没有成功地复制它(尽管我可能只是没有向他们提供足够的流量)。

我们确实使用了一堆具有 C 扩展名的模块(simplejson、hiredis 等),因此绝对可以相信它们可能是原因。

寻找方法来追踪这一点。

4

1 回答 1

2

你使用的是什么版本的 Python?在 Python 2.4 中,Python 内存分配器没有将内存返回给操作系统。

仍然在较新的版本中,您可以看到与 Python 的内存分配器相关的问题,该内存分配器保留释放的简单类型列表,或者如果您在 Linux 上运行,则存在 glibc 的 malloc 实现如何从操作系统分配内存的固有问题。看看http://effbot.org/pyfaq/why-doesnt-python-release-the-memory-when-i-delete-a-large-object.htmhttp://pushingtheweb.com/2010/ 06/python 和 tcmalloc/

于 2013-01-09T09:01:46.067 回答