14

在我的一台服务器上,我有一些内存/磁盘 KV 服务,Memory KV 的行为类似于 memcached,在初始化时要求大量内存(10GB),Disk Kv 的行为类似于 leveldbd,它的随机读取和顺序写入,而且它经常读取很多文件。内存全部使用 libc malloc 分配。

我的 KV 服务器进程并没有消耗大量内存,如下所示(由于内存不足,我已经杀死了内存 KV,只留下了磁盘 KV,但可用内存仍然下降):

:~$top
PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
20 0 5030m 3.9g 2772 S 8 6.1 10430:52 tair_server
20 0 4833m 3.9g 4560 S 8 6.1 10171:07 tair_server
20 0 4844m 3.9g 3844 S 38 6.1 10073:32 tair_server
20 0 4765m 3.8g 4144 S 8 6.0 10552:39 tair_server
20 0 2941m 2.4g 9.8m S 0 3.8 256:45.70 tair_server
20 0 2953m 2.4g 12m S 1 3.7 276:54.64 tair_server

但是,我的记忆已经消失了。

$free -m

             total       used       free     shared    buffers     cached
Mem:         64552      57778       6774          0         16        326
-/+ buffers/cache:      57435       7117
Swap:            0          0          0

我可以看到平板消耗了我的大量内存,而且它是不可回收的。

$cat /proc/meminfo
MemTotal:       66101892 kB
MemFree:         6816228 kB
Buffers:           17024 kB
Cached:           456640 kB
SwapCached:            0 kB
Active:         19697712 kB
Inactive:        3197312 kB
Active(anon):   19546504 kB
Inactive(anon):  2875632 kB
Active(file):     151208 kB
Inactive(file):   321680 kB
Unevictable:          48 kB
Mlocked:               0 kB
SwapTotal:             0 kB
SwapFree:              0 kB
Dirty:              6612 kB
Writeback:            72 kB
AnonPages:      22421152 kB
Mapped:            54408 kB
Shmem:               332 kB
Slab:           28870400 kB
SReclaimable:     213344 kB
SUnreclaim:     28657056 kB
KernelStack:       30000 kB
PageTables:        62776 kB
NFS_Unstable:          0 kB
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:    33050944 kB
Committed_AS:   37517224 kB
VmallocTotal:   34359738367 kB
VmallocUsed:      388624 kB
VmallocChunk:   34324313700 kB
HardwareCorrupted:     0 kB
HugePages_Total:       0
HugePages_Free:        0
HugePages_Rsvd:        0
HugePages_Surp:        0
Hugepagesize:       2048 kB
DirectMap4k:        5696 kB
DirectMap2M:     2082816 kB
DirectMap1G:    65011712 kB

这是平板信息。

$slabtop -s c

OBJS ACTIVE  USE OBJ SIZE  SLABS OBJ/SLAB CACHE SIZE NAME  
69842766 69838389  38%    0.19K 1663025       42  13304200K kmalloc-192
69314912 69314796  38%    0.12K 2166091       32   8664364K kmalloc-128
70866624 70866323  39%    0.06K 1107291       64   4429164K kmalloc-64
69299968 69299592  38%    0.03K 541406      128   2165624K kmalloc-32
128388  72434  56%    0.99K   4230       32    135360K ext4_inode_cache
208782  94112  45%    0.19K   4971       42     39768K dentry

我不明白什么会消耗大量内存,为什么会这样,以及如何解决这个问题。

这可能是间隔内核错误吗?

或者这是一个 glibc 问题,由于频繁的磁盘读取,它没有将内存返回给系统?

4

2 回答 2

1

看起来您的发行版有点旧,但没关系。不要听那些告诉你必须先升级才能查看unmae -a输出的人。但是,如果您提供它会很好...

在较新版本的服务器和桌面发行版中,免费命令输出和/proc/meminfo包含多行的目的是为了消除您所遇到的那种混淆。行名在输出中为“MemAvailable”,/proc/meminfofree输出中为“available”。

中的“free”列free -m并未以人类理解的方式显示可用内存(因此 中的“MemFree”行/proc/meminfo)。它不排除内核的页面缓存和其他未以人类理解的方式“使用”的缓存。

这是第一件事。如果您认为我错了并且您free正确理解了输出,请尝试:echo 3 > /proc/sys/vm/drop_caches看看内存使用情况会发生什么。请提供free以 root 身份执行该命令后的输出。

如果它仍然那么糟糕,请阅读:https ://www.linuxquestions.org/questions/linux-server-73/very-high-slab-usage-hard-to-understand-901323/ 。它说您的内核可能必须升级。

于 2020-10-30T10:31:10.050 回答
-3

随top , free ,slabtop 的摘录提供

看起来你的内核正在吃掉内存板:28870400 kB

找到这个的一个非常简单的方法是 .

  1. 做一个 Top ,并做一个 RES 内存的总和(RAM 上的常驻内存), top 只给出内存的用户视图。

  2. 做一个 free -m 看看有多少内存是空闲和使用的(free given kernel + user)。总内存 - top RES 与 FREE 命令中被称为 free 的内存之间的差异不应太大 ~1 GB

“是时候提升你的操作系统版本了”

于 2015-04-30T12:35:18.193 回答