26

在此处输入图像描述

VisualVM 的屏幕截图是在我运行一个 IO 密集型 JVM 程序(用 Scala 编写)时拍摄的,堆大小为 4 GB,只有 2 GB 正在使用中。JVM 程序使用内存映射文件。

“映射缓冲池”和“直接缓冲池”是什么意思?

那些水池似乎很满。由于 JVM 程序使用内存映射文件,如果池更大,我会看到性能提高吗?如果是这样,如何增加它们的大小?

所有映射文件的大小约为 1.1GB。

4

1 回答 1

66

直接缓冲

直接缓冲区是一块内存,通常用于将 Java 连接到 OS I/O 子系统,例如,作为 OS 在从套接字或磁盘接收数据时写入数据的地方,Java 可以从中直接读取数据。

与操作系统共享缓冲区比将数据从操作系统复制到 Java 的内存模型中的原始方法要高效得多,这会使数据受到垃圾收集和低效率的影响,例如从伊甸园迁移数据时重新复制数据 - > 幸存者 -> 终身制 -> 到永久代。

在屏幕截图中,您只有一个 16KB 的直接缓冲区。Java 将根据需要增加这个池,因此蓝色区域位于块顶部的事实仅仅是一个声明,到目前为止分配的所有缓冲内存都在使用中。我不认为这是一个问题。

映射缓冲池

映射缓冲池是 Java 用于其FileChannel实例的所有内存。

每个 FileChannel 实例都有一个与操作系统共享的缓冲区(类似于具有所有效率优势的直接缓冲区)。内存本质上是文件一部分的 RAM 内窗口。根据模式(读取、写入或两者),Java 可以直接读取和/或修改文件的内容,操作系统可以直接向磁盘提供数据或将修改后的数据刷新到磁盘。

这种方法的其他优点是操作系统可以在它认为合适的时候将这个缓冲区直接刷新到磁盘上,例如当操作系统关闭时,操作系统可以锁定该部分文件,使其不被计算机上的其他进程访问。

屏幕截图表明您有大约 680MB 被 12 个 FileChannel 对象使用。同样,Java 会增长,这是因为 Scala 需要更多(并且 JVM 可以从操作系统获得额外的内存),所以所有 680MB 都在使用中这一事实并不重要。考虑到它们的大小,在我看来,程序已经被优化以有效地使用这些缓冲区。

增加映射缓冲池的大小

Java 在垃圾收集空间之外为 FileChannel 缓冲区分配内存。这意味着正常的堆大小参数-Xmx在这里并不重要

FileChannel 中缓冲区的大小由map方法设置。改变这将需要改变你的 Scala 程序

一旦缓冲区达到阈值大小,大约为 10s-100s KB,增加 FileChannel 缓冲区大小可能会或可能不会提高性能 - 这取决于程序如何使用缓冲区:

  • :如果文件从头到尾被精确读取一次:几乎所有时间都在等待磁盘或处理算法
  • Maybe:但是,如果算法频繁扫描文件多次访问部分,则增加大小可能会提高性能:
    • 如果修改或写入文件,更大的缓冲区可以将更多的写入合并到一次刷新中。
    • 如果读取文件,操作系统可能已经缓存了文件(磁盘缓存),因此任何收益都可能是微不足道的。不恰当地增加 JVM 的大小可能会通过缩小有效磁盘缓存大小来降低性能
    • 在任何情况下,应用程序都必须经过专门编码才能获得任何好处,例如通过在缓存上实现其自己的逻辑记录指针。

尝试分析应用程序并查找 I/O 等待(Jprofiler 和 YourKit 擅长此操作)。可能文件 I/O 实际上不是问题——不要成为过早优化的受害者。如果 I/O 等待占总运行时间的很大一部分,那么可能值得尝试更大的缓冲区大小

更多信息

https://blogs.oracle.com/alanb/entry/monitoring_direct_buffers

另请注意,JVM 上报告了一个错误,指出 FileChannel 不擅长释放内存。在使用 java.nio.MappedByteBuffer 时防止 OutOfMemory中有详细说明

于 2013-04-02T03:45:14.953 回答