在我们的应用程序中,我们有一些数据结构,其中包含一个分块的字节列表(当前公开为List<byte[]>
)。我们将字节分块,因为如果我们允许将字节数组放在大对象堆上,那么随着时间的推移,我们会遭受内存碎片的困扰。
我们还开始使用 Protobuf-net 序列化这些结构,使用我们自己生成的序列化 DLL。
然而,我们注意到 Protobuf-net 在序列化时创建了非常大的内存缓冲区。浏览源代码,它似乎可能在整个结构被写入之前无法刷新其内部缓冲区,List<byte[]>
因为它需要在之后将总长度写入缓冲区的前面。
不幸的是,这首先取消了我们对字节进行分块的工作,并最终由于内存碎片给了我们 OutOfMemoryExceptions(异常发生在 Protobuf-net 试图将缓冲区扩展到超过 84k 的时候,这显然把它放在LOH,我们的整体进程内存使用率相当低)。
如果我对 Protobuf-net 工作原理的分析是正确的,有没有办法解决这个问题?
更新
根据马克的回答,这是我尝试过的:
[ProtoContract]
[ProtoInclude(1, typeof(A), DataFormat = DataFormat.Group)]
public class ABase
{
}
[ProtoContract]
public class A : ABase
{
[ProtoMember(1, DataFormat = DataFormat.Group)]
public B B
{
get;
set;
}
}
[ProtoContract]
public class B
{
[ProtoMember(1, DataFormat = DataFormat.Group)]
public List<byte[]> Data
{
get;
set;
}
}
然后序列化它:
var a = new A();
var b = new B();
a.B = b;
b.Data = new List<byte[]>
{
Enumerable.Range(0, 1999).Select(v => (byte)v).ToArray(),
Enumerable.Range(2000, 3999).Select(v => (byte)v).ToArray(),
};
var stream = new MemoryStream();
Serializer.Serialize(stream, a);
ProtoWriter.WriteBytes()
但是,如果我在它调用方法底部的位置放置一个断点DemandSpace()
并进入DemandSpace()
,我可以看到缓冲区没有被刷新,因为writer.flushLock
equals 1
。
如果我像这样为 ABase 创建另一个基类:
[ProtoContract]
[ProtoInclude(1, typeof(ABase), DataFormat = DataFormat.Group)]
public class ABaseBase
{
}
[ProtoContract]
[ProtoInclude(1, typeof(A), DataFormat = DataFormat.Group)]
public class ABase : ABaseBase
{
}
然后writer.flushLock
等于。2
_DemandSpace()
我猜我在这里错过了一个与派生类型有关的明显步骤?