Ehcache讨论了堆内和堆外内存。有什么区别?使用哪些 JVM 参数来配置它们?
6 回答
堆上存储是指将出现在 Java 堆中的对象(并且也受 GC)。另一方面,堆外存储是指由 EHCache 管理的(序列化)对象,但存储在堆外(也不受 GC 影响)。由于堆外存储继续在内存中进行管理,它比堆上存储稍慢,但仍比磁盘存储快。
问题中发布的链接中涉及管理和使用非堆存储的内部细节不是很明显,因此最好查看用于管理非磁盘的Terracotta BigMemory的详细信息店铺。BigMemory(堆外存储)用于避免 GC 在几兆字节或千兆字节大的堆上的开销。BigMemory 使用 JVM 进程的内存地址空间,通过与其他原生 Java 对象不同的是不受 GC 影响的直接 ByteBuffers 。
来自http://code.google.com/p/fast-serialization/wiki/QuickStartHeapOff
什么是堆卸载?
通常,您分配的所有非临时对象都由 java 的垃圾收集器管理。尽管虚拟机在垃圾收集方面做得不错,但在某些时候虚拟机必须执行所谓的“Full GC”。完整 GC 涉及扫描完整分配的堆,这意味着 GC 暂停/减速与应用程序堆大小成正比。所以不要相信任何告诉你“内存很便宜”的人。在 java 中,内存消耗会损害性能。此外,如果堆大小 > 1 Gb,您可能会出现明显的暂停。如果您有任何近乎实时的事情正在进行,这可能会很糟糕,在集群或网格中,java 进程可能会变得无响应并从集群中删除。
然而,今天的服务器应用程序(通常建立在臃肿的框架之上;-))很容易需要远远超过 4Gb 的堆。
这些内存需求的一种解决方案是将对象的一部分“卸载”到非 Java 堆(直接从操作系统分配)。幸运的是,java.nio 提供了类来直接分配/读取和写入“非托管”内存块(甚至是内存映射文件)。
因此,可以分配大量“非托管”内存并使用它来保存对象。为了将任意对象保存到非托管内存中,最可行的解决方案是使用序列化。这意味着应用程序将对象序列化到堆外内存中,稍后可以使用反序列化读取对象。
由 java VM 管理的堆大小可以保持较小,因此 GC 暂停以毫秒为单位,每个人都很高兴,工作完成。
很明显,这种堆外缓冲区的性能主要取决于序列化实现的性能。好消息:由于某种原因,FST 序列化非常快:-)。
示例使用场景:
- 服务器应用程序中的会话缓存。使用内存映射文件来存储千兆字节的(非活动)用户会话。一旦用户登录到您的应用程序,您就可以快速访问与用户相关的数据,而无需处理数据库。
- 计算结果的缓存(查询、html 页面、..)(仅适用于计算比反序列化结果对象的 c 慢的情况)。
- 使用内存映射文件非常简单和快速的持久性
编辑:对于某些情况,可能会选择更复杂的垃圾收集算法,例如 ConcurrentMarkAndSweep 或 G1 来支持更大的堆(但这也有超过 16GB 堆的限制)。还有一个具有改进的“无暂停”GC (Azul) 的商业 JVM。
堆是内存中动态分配的对象所在的位置。如果你用过new
,那么它就在堆上。这与堆栈空间相反,堆栈空间是函数堆栈所在的位置。如果您有一个局部变量,那么该引用就在堆栈上。Java 的堆受到垃圾回收的影响,对象可以直接使用。
EHCache 的堆外存储将您的常规对象从堆中取出,对其进行序列化,并将其作为字节存储在 EHCache 管理的一块内存中。这就像将它存储到磁盘但它仍然在 RAM 中。对象在这种状态下不能直接使用,它们必须首先反序列化。也不受垃圾收集的影响。
不是100%;但是,听起来堆是一个对象或一组已分配空间(在 RAM 上),它内置于 Java 本身或更可能来自 ehcache 本身的代码功能中,并且堆外 RAM 有自己的系统出色地; 但是,这听起来慢了一个数量级,因为它没有那么有条理,这意味着它可能不使用堆(意味着一组长的 ram 空间),而是使用不同的地址空间,这可能会使其效率略低。
当然,下一层是硬盘空间本身。
我不使用 ehcache,所以你可能不想相信我,但那是我从他们的文档中收集到的。
JVM 对堆外内存一无所知。Ehcache 实现了磁盘缓存和内存缓存。