1

假设这样一个类:

class Person {
  public string Name;
  public Person Parent;
}

现在创建两个对象:

...
Person mike = new Person("Mike");
Person jack = new Person("Jack");
jack.Parent = mike;
List<Person> family = new List<Person>();
people.Add(mike);
people.Add(jack);
...

字符串“Mike”会被序列化一次(保持)对对象 mike 的唯一引用然后解析它,还是会被序列化两次?

4

1 回答 1

3

这里的答案是“视情况而定”。protobuf 规范不包括任何对象标识符/重用,因此通常(默认情况下)这将是一个树序列化,并且数据将被复制。

我们可以通过使用具有所有默认行为的protobuf-net 来检查这一点:

using ProtoBuf;
using System;
using System.Collections.Generic;
using System.Linq;

class Program
{
    static void Main()
    {
        Person mike = new Person { Name = "Mike" };
        Person jack = new Person { Name = "Jack" };
        jack.Parent = mike;
        List<Person> people = new List<Person>();
        people.Add(mike);
        people.Add(jack);

        var cloneOfEverything = Serializer.DeepClone(people);

        var newMike = cloneOfEverything.Single(x => x.Name == "Mike");
        var newJack = cloneOfEverything.Single(x => x.Name == "Jack");
        Console.WriteLine(jack.Parent.Name); // writes Miks as expected

        bool areSamePersonObject = ReferenceEquals(newMike, newJack.Parent);
        // False ^^^

        bool areSameStringInstance = ReferenceEquals(
            newMike.Name, newJack.Parent.Name);
        // True ^^^
    }
}
[ProtoContract]
class Person
{
    [ProtoMember(1)]
    public string Name;
    [ProtoMember(2)]
    public Person Parent;
}

观察:

  • 杰克的父母正确地称为迈克
  • 但它是一个看起来相同的不同对象实例
  • string是同一个实例——作为一个实现细节,protobuf-net 包含在数据中发现相同 UTF-8 块的代码,并重复使用相同的string实例以避免分配——但数据在二进制文件中包含两次
  • 对于信息,上面的树需要 24 个字节

我们也可以通过调查这里发生的事情来看到这一点:

Person mike = new Person { Name = "Mike" };
mike.Parent = mike;
var clone = Serializer.DeepClone(mike);

因为它是以树的形式写的,所以它会出错:

检测到可能的递归(偏移量:1 级):人

然而!作为特定于库的实现细节,protobuf-net 包含许多可以转动的旋钮和刻度盘。其中之一与对象身份有关。我们可以切换Person以使用参考身份进行操作:

[ProtoContract(AsReferenceDefault=true)]
class Person {...}

会更改二进制文件中的数据(以包括其他标记),因此 - 现在相同的行起作用了:

Person mike = new Person { Name = "Mike" };
mike.Parent = mike;
var clone = Serializer.DeepClone(mike);
bool areSamePersonObject = ReferenceEquals(clone, clone.Parent);
// ^^^ true

请注意,这使用了特定于实现的细节,并且可能会混淆其他实现。

AsReferenceDefault此处指出,Person无论何时看到都应将其视为参考;对于更精细的控制,[ProtoMember]还包括一个AsReference可以单独使用的对象。然而,快速检查似乎表明它目前无法正常工作List<Person>- 我需要对此进行调查。可能有一个很好的理由,但我目前想不出一个,我怀疑这是一个错误。

AsReference也可以包含在string成员中以避免重复写入相同的字符串 - 尽管请注意,在这种情况下,写入"Mike"两次可能更便宜!string当重复多次相同时,此选项将很有。尽管有名称,但在使用 时stringAsReference会被解释为“字符串相等”,而不是“引用相等”。

于 2013-09-12T15:01:16.087 回答