我有一个在 uwsgi 下运行的 django 网络服务器,它似乎泄漏了内存。
具体来说,进程的 RSS 缓慢增长,直到最终我不得不重新启动它。
我知道其他类似的问题,但是到目前为止发现的所有解决方案/结论似乎都不适用于这种情况(我可以找到)。
到目前为止,我已经使用meliae、Heapy、pympler和objgraph来检查 python 堆,它们都报告了同样的事情:一个正常的堆使用大约 40MB 的内存(预期),随着时间的推移几乎没有变化(根据需要)。
不幸的是,这与进程 RSS 完全不一致,RSS 将愉快地增长到 400MB+,而不会反映在 python 堆大小中。
一些示例输出来说明我的观点 -
Pympler 输出比较 python 堆/对象内存与进程 RSS:
Memory snapshot:
types | # objects | total size
============================================= | =========== | ============
dict | 20868 | 19852512
str | 118598 | 11735239
unicode | 19038 | 10200248
tuple | 58718 | 5032528
type | 1903 | 1720312
code | 13225 | 1587000
list | 11393 | 1289704
datetime.datetime | 6953 | 333744
int | 12615 | 302760
<class 'django.utils.safestring.SafeUnicode | 18 | 258844
weakref | 2908 | 255904
<class 'django.db.models.base.ModelState | 3172 | 203008
builtin_function_or_method | 2612 | 188064
function (__wrapper__) | 1469 | 176280
cell | 2997 | 167832
getset_descriptor | 2106 | 151632
wrapper_descriptor | 1831 | 146480
set | 226 | 143056
StgDict | 217 | 138328
---------------------------
Total object memory: 56189 kB
Total process usage:
- Peak virtual memory size: 549016 kB
- Virtual memory size: 549012 kB
- Locked memory size: 0 kB
- Peak resident set size: 258876 kB
- Resident set size: 258868 kB
- Size of data segment: 243124 kB
- Size of stack segment: 324 kB
- Size of code segment: 396 kB
- Shared library code size: 57576 kB
- Page table entries size: 1028 kB
---------------------------
显示类似内容的大量输出
Memory snapshot:
Partition of a set of 289509 objects. Total size = 44189136 bytes.
Index Count % Size % Cumulative % Kind (class / dict of class)
0 128384 44 12557528 28 12557528 28 str
1 61545 21 5238528 12 17796056 40 tuple
2 5947 2 3455896 8 21251952 48 unicode
3 3618 1 3033264 7 24285216 55 dict (no owner)
4 990 0 2570448 6 26855664 61 dict of module
5 2165 1 1951496 4 28807160 65 type
6 16067 6 1928040 4 30735200 70 function
7 2163 1 1764168 4 32499368 74 dict of type
8 14290 5 1714800 4 34214168 77 types.CodeType
9 10294 4 1542960 3 35757128 81 list
<1046 more rows. Type e.g. '_.more' to view.>
---------------------------
Total process usage:
- Peak virtual memory size: 503132 kB
- Virtual memory size: 503128 kB
- Locked memory size: 0 kB
- Peak resident set size: 208580 kB
- Resident set size: 208576 kB
- Size of data segment: 192668 kB
- Size of stack segment: 324 kB
- Size of code segment: 396 kB
- Shared library code size: 57740 kB
- Page table entries size: 940 kB
---------------------------
请注意,在这两种情况下,报告的堆大小为 40-50MB,而进程 RSS 为 200MB+。
我还使用了 objgraph 的get_leaking_objects()来尝试查看 C 扩展是否进行了错误的引用计数,但是不可 gc'able 对象的数量不会随着时间的推移而显着增长。
有没有人对如何进行调试有任何见解?在这一点上,我假设是以下两种情况之一:
- 我有一个 C 扩展在内部泄漏内存
- uwsgi 本身正在泄漏内存(尽管我在网上找不到其他证据)
值得一提的是,我在任何类型的开发环境中都没有成功地复制它(尽管我可能只是没有向他们提供足够的流量)。
我们确实使用了一堆具有 C 扩展名的模块(simplejson、hiredis 等),因此绝对可以相信它们可能是原因。
寻找方法来追踪这一点。