5

我目前正在寻找一个好的 OO 设计来序列化 C++/Qt 应用程序。
想象一下基于树结构组织的应用程序的类,使用复合模式实现,如下图所示。

我想到的两个可能的原则:

1.)
将 save()/load() 函数放在每个必须可序列化的类中。如果多次看到这种情况,通常使用 boost 来实现。在课堂上的某个地方,您会发现类似这样的内容:

friend class boost::serialization::access;
template<class Archive>
void serialize(Archive & ar, const unsigned int version)
{
    ar & m_meber1;
}

你也可以把它分成 save() 和 load()。但这种方法的缺点是:
如果你想在两个月后改变序列化(到 XML、HTML 或一些非常奇怪的东西,boost 不支持)你必须采用所有数千个类。在我看来,这不是一个好的 OO 设计。
如果您想同时支持不同的序列化(XML、二进制、ASCII 等等),那么 80% 的 cpp 仅用于序列化函数。

2.)
我知道 boost 还提供了序列化的非侵入式版本

“http://www.boost.org/doc/libs/1_49_0/libs/serialization/doc/tutorial.html”

所以另一种方法是实现一个迭代器,它迭代复合树结构并序列化每个对象(以及一个用于反序列化的迭代器)
(我认为这是 .NET-Framework 的 XmlSerializer-Class 所做的,但我不是非常熟悉 .NET)
这听起来更好,因为单独的 save() 和 load() 并且如果序列化发生更改,只有一个地方可以更改。
所以这听起来更好,但是:
- 您必须为要序列化的每个参数提供一个 setter() 和一个 getter()。(所以,不再有私有数据了。(这是好/坏吗?))
- 您可能有一个长的继承层次结构(超过 5 个类)挂在复合树上。
那么如何调用派生类的setter()/getter()呢?当您只能调用基础 Composite-Component 的接口函数时。

另一种方法是将对象数据序列化为单独的抽象格式。所有可能的后续序列化(XML、TEXT、任何可能的)都从中获取数据。一个想法是将其序列化为 QDomNode。但我认为额外的抽象会降低性能。

所以我的问题是:
有没有人知道用于序列化的好的 OO 设计?
也许来自其他编程语言,如 JAVA、Python、C# 等等......

谢谢你。

4

1 回答 1

4

小心序列化。

序列化是拍摄内存中表示的快照并在以后恢复它。

这一切都很好,除了当您考虑使用较新版本的软件(向后兼容性)加载先前存储的快照或(上帝禁止)使用旧版本的软件(前向兼容性)。

许多结构可以轻松处理向后兼容性,但是向前兼容性要求您的新格式非常接近其先前的迭代:基本上,只需添加/删除一些字段,但保持相同的整体结构。

问题在于,出于性能原因,序列化倾向于将磁盘结构与内存表示联系起来。然后,更改内存中的表示需要弃用旧存档(和/或迁移实用程序)。

另一方面,消息系统(这就是 google protobuf 是什么)是关于将交换的消息结构与内存中的表示分离,以便您的应用程序保持灵活性。

因此,您首先需要选择是实现序列化还是消息传递


现在你是对的,你可以在类内或类外编写保存/加载代码。这又是一个权衡:

  • 类内代码可以立即访问所有成员,通常更高效和直接,但灵活性较差,因此它与序列化齐头并进
  • 类外代码需要间接访问(getter、访问者层次结构),效率较低,但更灵活,因此它与消息传递密切相关

请注意,隐藏状态没有缺点。Aclass没有(真正的)隐藏状态:

  • 缓存(mutable值)就是这样,它们可以放心丢失
  • 隐藏类型(thinkFILE*或其他句柄)通常可以通过其他方式恢复(例如,序列化文件名)
  • ...

我个人使用两者的混合。

  • 缓存是为当前版本的程序编写的,并在v1. 编写新代码以同时使用v1v2,并v1默认写入,直到以前的版本消失;然后切换到写作v2(假设它很容易)。有时,大规模的重构会使向后兼容性变得太痛苦,我们此时将其放在地板上(并增加主要数字)。
  • 另一方面,与其他应用程序/服务的交换和更持久的存储(数据库或文件中的 blob)使用消息传递,因为我不想在未来 10 年内将自己束缚在特定的代码结构上。

注意:我正在研究服务器应用程序,所以我的建议反映了这种环境的细节。我想客户端应用程序必须永远支持旧版本......

于 2012-06-05T19:54:59.483 回答