c++ - C++ 序列化的良好设计

Question

我目前正在寻找一个好的 OO 设计来序列化 C++/Qt 应用程序。
想象一下基于树结构组织的应用程序的类，使用复合模式实现，如下图所示。

我想到的两个可能的原则：

1.)
将 save()/load() 函数放在每个必须可序列化的类中。如果多次看到这种情况，通常使用 boost 来实现。在课堂上的某个地方，您会发现类似这样的内容：

friend class boost::serialization::access;
template<class Archive>
void serialize(Archive & ar, const unsigned int version)
{
    ar & m_meber1;
}

你也可以把它分成 save() 和 load()。但这种方法的缺点是：
如果你想在两个月后改变序列化（到 XML、HTML 或一些非常奇怪的东西，boost 不支持）你必须采用所有数千个类。在我看来，这不是一个好的 OO 设计。
如果您想同时支持不同的序列化（XML、二进制、ASCII 等等），那么 80% 的 cpp 仅用于序列化函数。

2.)
我知道 boost 还提供了序列化的非侵入式版本

“http://www.boost.org/doc/libs/1_49_0/libs/serialization/doc/tutorial.html”

所以另一种方法是实现一个迭代器，它迭代复合树结构并序列化每个对象（以及一个用于反序列化的迭代器）
（我认为这是 .NET-Framework 的 XmlSerializer-Class 所做的，但我不是非常熟悉 .NET）
这听起来更好，因为单独的 save() 和 load() 并且如果序列化发生更改，只有一个地方可以更改。
所以这听起来更好，但是：
- 您必须为要序列化的每个参数提供一个 setter() 和一个 getter()。（所以，不再有私有数据了。（这是好/坏吗？））
- 您可能有一个长的继承层次结构（超过 5 个类）挂在复合树上。
那么如何调用派生类的setter()/getter()呢？当您只能调用基础 Composite-Component 的接口函数时。

另一种方法是将对象数据序列化为单独的抽象格式。所有可能的后续序列化（XML、TEXT、任何可能的）都从中获取数据。一个想法是将其序列化为 QDomNode。但我认为额外的抽象会降低性能。

所以我的问题是：
有没有人知道用于序列化的好的 OO 设计？
也许来自其他编程语言，如 JAVA、Python、C# 等等......

谢谢你。

score 4 · Accepted Answer

小心序列化。

序列化是拍摄内存中表示的快照并在以后恢复它。

这一切都很好，除了当您考虑使用较新版本的软件（向后兼容性）加载先前存储的快照或（上帝禁止）使用旧版本的软件（前向兼容性）。

许多结构可以轻松处理向后兼容性，但是向前兼容性要求您的新格式非常接近其先前的迭代：基本上，只需添加/删除一些字段，但保持相同的整体结构。

问题在于，出于性能原因，序列化倾向于将磁盘结构与内存表示联系起来。然后，更改内存中的表示需要弃用旧存档（和/或迁移实用程序）。

另一方面，消息系统（这就是 google protobuf 是什么）是关于将交换的消息结构与内存中的表示分离，以便您的应用程序保持灵活性。

因此，您首先需要选择是实现序列化还是消息传递。

现在你是对的，你可以在类内或类外编写保存/加载代码。这又是一个权衡：

类内代码可以立即访问所有成员，通常更高效和直接，但灵活性较差，因此它与序列化齐头并进
类外代码需要间接访问（getter、访问者层次结构），效率较低，但更灵活，因此它与消息传递密切相关

请注意，隐藏状态没有缺点。Aclass没有（真正的）隐藏状态：

缓存（mutable值）就是这样，它们可以放心丢失
隐藏类型（thinkFILE*或其他句柄）通常可以通过其他方式恢复（例如，序列化文件名）
...

我个人使用两者的混合。

缓存是为当前版本的程序编写的，并在v1. 编写新代码以同时使用v1和v2，并v1默认写入，直到以前的版本消失；然后切换到写作v2（假设它很容易）。有时，大规模的重构会使向后兼容性变得太痛苦，我们此时将其放在地板上（并增加主要数字）。
另一方面，与其他应用程序/服务的交换和更持久的存储（数据库或文件中的 blob）使用消息传递，因为我不想在未来 10 年内将自己束缚在特定的代码结构上。

注意：我正在研究服务器应用程序，所以我的建议反映了这种环境的细节。我想客户端应用程序必须永远支持旧版本......

c++ - C++ 序列化的良好设计

1 回答 1

Related