4

我们需要BSON 等价

{
    "Header": {
        "SubHeader1": {
            "Name": "Bond",
            "License": 7
        },
        "SubHeader2": {
            "IsActive": true
        }
    },
    "Payload": /* This will be a 40GB byte stream! */
}

但我们得到的是:

在此处输入图像描述

如您所见,有效载荷首先出现,然后是标题的其余部分!

我们正在使用 Json.NET 的 BSON writer ( Bson.BsonWriter.WriteValue(byte[] value)),但它只接受实际byte[]Stream. 由于我们的有效负载将是 10 GB,我们必须使用流,所以我们尝试解决(下面的代码),但这给了我们上面显示的错误结果

public void Expt()
{
    // Just some structure classes, defined below
    var fileStruct = new FileStructure();

    using (Stream outputSt = new FileStream("TestBinary.bson", FileMode.Create))
    {
        var serializer = new JsonSerializer();
        var bw = new BsonWriter(outputSt);

        // Start
        bw.WriteStartObject();

        // Write header            
        bw.WritePropertyName("Header");
        serializer.Serialize(bw, fileStruct.Header);

        // Write payload
        bw.WritePropertyName("Payload");
        bw.Flush(); // <== flush !                
        // In reality we 40GB into the stream, dummy example for now
        byte[] dummyPayload = Encoding.UTF8.GetBytes("This will be a 40GB byte stream!");
        outputSt.Write(dummyPayload, 0, dummyPayload.Length);

        // End
        bw.WriteEndObject();
    }    
}

尽管我们在将有效负载写入底层流之前实际上向 Json.NET 发出了 Flush,但这看起来像是没有同步/不刷新缓冲区的经典案例。

问题:还有其他方法可以做到这一点吗?我们宁愿不分叉 Json.NET 的源代码(并探索它的内部管道)或以某种方式重新发明轮子......


详细信息:支持结构类是(如果你想重现这个)

public class FileStructure
{
    public TopHeader Header { get; set; }
    public byte[] Payload { get; set; }

    public FileStructure()
    {
        Header = new TopHeader
            {
                SubHeader1 = new SubHeader1 {Name = "Bond", License = 007},
                SubHeader2 = new SubHeader2 {IsActive = true}
            };
    }
}

public class TopHeader
{
    public SubHeader1 SubHeader1 { get; set; }
    public SubHeader2 SubHeader2 { get; set; }
}

public class SubHeader1
{
    public string Name { get; set; }
    public int License { get; set; }
}

public class SubHeader2
{
    public bool IsActive { get; set; }
}
4

1 回答 1

1

好的,所以我们在这里达到了一些中间立场,因为我们没有时间(目前)修复其他很棒的 Json.NET 库。因为我们很幸运只有在最后才拥有 Stream,所以我们现在使用 BSON 作为标头(对于 a 来说足够小byte[]),然后将其传递给标准流编写器,即表示为:

{
    "SubHeader1": {
        "Name": "Bond",
        "License": 7
    },
    "SubHeader2": {
        "IsActive": true
    }
} /* End of valid BSON */
// <= Our Stream is written here, raw byte stream, no BSON

拥有一个统一的 BSON 布局会更美观,但如果没有它,这也很好用。应该也快一点吧!如果将来有人仍然找到更好的答案,我们正在倾听。

于 2013-06-14T16:42:52.267 回答