我有一个网络客户端,它处理来自服务器的数据。
数据作为一系列消息发送,它们本身是键/值集合,在概念上类似于 HTTP 标头(除了没有“消息体”),这是一个典型的单向消息(行分隔\r\n
):
Response: OK
Channel: 123
Status: OK
Message: Spectrum is green
Author: Gerry Anderson
Foo123: Blargh
我的协议客户端通过使用andNetworkStream
逐个字符读取,并使用状态机解析器和实例来填充实例。然后将这些 Dictionary 实例保存到内存结构中以供进一步处理,它们的使用寿命通常约为 10 分钟。StreamReader
while( (nc = rdr.Read()) != -1 )
StringBuilder
Dictionary<String,String>
我的客户每小时会收到数千条这样的消息,并且客户端进程是持久的——这是一个问题,因为我的客户端进程经常增长到从这些String
实例中消耗超过 2GB 的内存——我使用 windbg 来查看所有内存的去向. 这是一个问题,因为代码在只有 3.5GB 内存的 Azure VM 上运行。我看不出为什么我的程序最多应该消耗超过几百 MB 的 RAM。通常我会照看虚拟机并观察我的进程的内存消耗随着时间的推移,它会稳步增长到大约 2GB,然后随着 GC 的收集运行突然下降到大约 100MB,然后它会再次增长。GC 运行之间的时间可能会有所不同,根本无法预测。
因为这些字符串中有很多是相同的(例如键Response
,Status
等)以及已知值OK
,Fail
所以我可以使用字符串实习来减少使用,如下所示:
// In the state-machine parser after having read a Key name:
String key = stringBuilder.ToString();
key = String.Intern( key );
// etc... after reading value
messageDictionary.Add( key, value );
问题是我看到了额外优化的空间:sb.ToString()
将分配一个新的字符串实例,它将用于实习,其次:实习字符串在 appdomain 的生命周期内持续存在,不幸的是有些键不会看到重新-use 并且实际上会浪费内存,例如Foo123
在我的协议示例中。
我认为的一种解决方案是不使用字符串实习,而是有一个包含static readonly
字符串字段的类,这些字段是已知的键,然后使用普通的非实习字符串——这最终会被 GC 处理,因此不会冒着填满字符串实习池的风险一次性字符串。然后我会将StringBuilder
实例与这些已知字符串进行比较,如果是,则使用它们而不是调用sb.ToString()
从而跳过另一个字符串分配。
但是,如果我确实选择实习生每个字符串,实习生池将继续增长,不幸的是.NET似乎没有.Chlorinate()
字符串池的方法,有没有办法从实习生池中删除一次性字符串如果我继续这种String.Intern
方法,还是我最好使用我自己的静态只读字符串实例?