python - 带泡菜的模块化序列化（Python）

Question

我想以模块化的方式执行一些对象图的序列化。那就是我不想序列化整个图。原因是这张图很大。我可以保留图表某些部分的时间戳版本，并且我可以做一些惰性访问来推迟加载我现在不需要的部分。

我想我可以用 Python 中的元编程来管理这个。但似乎元编程在 Python 中还不够强大。

这就是我现在要做的。我的图表由几个不同的对象组成。其中一些是特殊类的实例。此类描述要腌制的根对象。这就是模块化的用武之地。每次我腌制一些东西时，它都会从其中一个实例开始，我从不同时腌制其中两个。每当有对另一个实例的引用，根对象可以访问时，我用一个persistant_id 替换这个引用，从而确保我不会在同一个酸洗流中拥有它们中的两个。解封流时出现问题。我可以找到一个尚未加载的实例的persistant_id。在这种情况下，我必须等待目标实例被加载，然后才能访问它。而且我无论如何也看不到这样做：

1/ 我试图构建一个获取方法返回引用目标的访问器。不幸的是，访问器必须放在类声明中，我不能将它们分配给未腌制的对象。2/我可以将引用必须解决的地方存储在某个地方。我认为这在 Python 中是不可能的：不能保留对位置（字段或变量）的引用，只能保留对值的引用。

我的问题可能不太清楚。我仍在寻找一个清晰的配方。我尝试了其他方法，例如使用显式引用，这将是某些“引用”类的实例。不过也不是很方便。

你知道如何用 pickle 实现模块化序列化吗？我是否必须更改 Unpickler 的内部行为才能记住我需要加载剩余对象图的位置？是否有另一个库更适合实现类似的结果？

score 0 · Accepted Answer

元编程在 Python 中很强大；Python 类具有极强的延展性。您可以在声明后随心所欲地更改它们，尽管最好在元类（装饰器）中完成。不仅如此，实例是可塑的，独立于它们的类。

“对地点的引用”通常只是一个字符串。例如，对对象字段的引用就是它的名称。假设您的节点对象中有多个节点引用。你可以有一些像{persistent_id: (object, field_name),..}你未解决的参考表这样的东西，很容易查找。同样，在节点列表中，“对地点的引用”是索引。

顺便说一句，您可以使用键值数据库进行图形存储吗？您无需等待即可按 ID 拉取节点。

score 0 · Accepted Answer

这就是我认为我会如何去做的事情。

有一个模块级字典将 persistent_id 映射到 SpecialClass 对象。每次初始化或取消选择SpecialClass实例时，请确保将其添加到字典中。
覆盖 SpecialClass 的__getattr__and__setattr__方法，以便specialobj.foo = anotherspecialobj仅将 persistent_id 存储在 specialobj 上的字典中（我们称之为specialobj.specialrefs）。当您检索specialobj.foo时，它会在 specialrefs 中找到名称，然后在模块级字典中找到引用。
有一个模块级check_graph函数，它将遍历已知SpecialClass实例并检查它们的所有特殊引用是否可用。

python - 带泡菜的模块化序列化（Python）

2 回答 2

Related

Reference