5

我有一种感觉,我要问一个“愚蠢”的问题,但我必须问......

我有2个虚拟机。

我想将一个对象的实例从一个复制到另一个,

是否可以在VM的堆中复制代表该对象的位,将其发送到另一个VM,就像另一个VM只需要在它的内存中分配位并在它的堆栈中添加一个引用到这个内存槽.. .?

目前,为了做这样的事情,我们序列化对象并反序列化它,这比直接复制实例效率低得多(计算方面)......解析是一种计算浪费......

JS 序列化示例:每个 VM 都是V8 (JavaScript) 的一个实例,一种方法是将对象转换为 JSON( JSON.stringify),将其发送给其他 VM,获取字符串并将其转换回对象(例如var myObject = eval('(' + myJSONtext + ')');) .. (JavaScript 在这里只是一个例子,这是某种序列化)

4

3 回答 3

7

让我们暂时忽略一个天真的假设,即您可以轻松地将这个问题推广到多个虚拟机上。任何构建此类机制的尝试都将在很大程度上取决于您为其构建机制的 VM 的实现细节。

以下是未执行此操作的几个原因:

  1. 内核表示通常不能跨架构移植。如果我在不知道其结构的情况下从 SPARC 机器上的 VM 向 x86 机器上的 VM 发送“对象”,则该对象在另一端会出现损坏。

  2. 该对象不一定存在于两台机器上的相同内存位置,因此对象内的内部指针需要在它到达第二个 VM 后进行修补。这也需要对象结构的内部知识。

  3. 该对象可能包含对其他对象的引用,因此复制对象意味着复制对象树,通常也不是非循环树。您最终构建的代码看起来非常像序列化库,以便可靠地执行此操作。

  4. 对象通常会保留无法跨机器可靠传输的本机资源(如文件句柄和套接字)。

  5. 在许多 VM 中,数据(您尝试复制的对象)和元数据(例如,您尝试复制的对象的类)之间存在区别。在这些类型的虚拟机中,即使您可以毫发无损地逐位复制对象,它也可能依赖于远程端不存在的一堆元数据。逐位复制元数据也很棘手,因为许多 VM 使用的实现技术(例如内部字符串的全局池或内存映射对象代码)使数据本质上是不可移植的。您也可能最终得到比您想要的更多的元数据(例如,在.net 中,您可以打包并发送到某处的最小元数据单元通常是一个程序集)。

  6. 内核表示通常不能在同一 VM 的不同版本之间移植,并且不包含可用于修补数据的内部版本信息。

  7. 内核表示包含许多不需要复制的东西(例如内联缓存、垃圾收集信息)。复制这些东西会很浪费,而且信息在另一边甚至可能不明智。

基本上,要可靠地做到这一点,您最终会构建世界上最笨拙和最不可靠的序列化库,而简单内存副本的性能提升在修补许多在您天真地进行复制时会损坏的东西时会丢失。

因此,这些机制往往不存在。

这条规则有一个巨大的例外:基于镜像的虚拟机(例如许多 smalltalk 和 self 虚拟机)是围绕虚拟机状态存在于可以在机器之间复制、移动等的“镜像”的想法构建的。这通常会带来可观的性能成本。

于 2010-08-26T13:23:58.733 回答
2

为什么不使用 cpickle。它将非常可靠且非常快速地序列化数据,然后您可以通过套接字、命名管道、mmap 发送它,除非在另一端,只要它在传输过程中没有损坏,您就可以可靠地重新组装它并且泡菜模块的版本并没有太大的不同。当然,真正的企业方式是使用与平台无关的标准,例如 XML,它可以让您将平台互操作性扩展到 Python 之外。我知道这回避了这个问题,但我认为为 python 解释器代码库做出贡献的人必须为你澄清这一点。

于 2010-08-26T16:16:29.267 回答
0

我确信在 VMware API 中无法进行这种直接内存传输;我不知道其他管理程序,但我仍然有点怀疑。VMware 有办法将整台机器的内存传送到另一台主机服务器(主要是通过使用分页文件),但没有什么方法可以从正在运行的程序中仅提取一块内存并将其提供给另一个 - 涉及的太多了那里。

因此,您现有的对象序列化策略绝对是满足此需求的良好且通用的解决方案,幸运的是,您正在使用的编程语言有很好的选择(PythonJava)。

但我想知道您是否真的需要将整个对象隐藏并重新创建,或者它是否只包含一些数据。如果数据没有过多,您可以使用某种远程方法调用从源 VM 向接收器发送消息,告诉它使用此数据创建一个对象。在这种情况下,您将只序列化必要的数据,并让目标机器在自己的内存中重新构建对象。

于 2010-08-26T13:28:22.727 回答