Spring Boot的JVM的内存占用与Docker - spring.io

JVM可能是一个复杂的野兽。值得庆幸的是，大部分复杂性都在幕后，我们作为应用程序开发人员和部署人员通常不必过于担心。随着基于容器的部署策略的兴起，需要引起注意的一个复杂领域是JVM的内存占用。

两种内存
JVM将其内存分为两大类：堆内存和非堆内存。堆内存是人们通常最熟悉的部分。它是存储由应用程序创建的对象的位置。它们一直存在，直到它们不再被引用并被垃圾收集。通常，应用程序使用的堆量将根据当前负载而波动。
JVM的非堆内存分为几个不同的区域。我们可以使用HotSpot VM的本机内存跟踪（NMT）来检查这些区域的内存使用情况。请注意，虽然NMT不跟踪所有原生本机Native内存使用情况（例如，它不跟踪第三方本机代码内存分配），但对于大类典型的Spring应用程序来说已经足够了。可以通过启动应用程序-XX:NativeMemoryTracking=summary然后使用jcmd <pid> VM.native_memory summary来显示内存使用情况摘要来使用NMT 。
让我们通过查看应用程序来说明NMT的使用，在这种情况下，我们的老朋友Petclinic。下面的饼图显示了当使用48MB最大堆（-Xmx48M）启动Petclinic时由NMT报告的JVM的内存使用量（减去其自身的开销）：

正如您所看到的，非堆内存占绝大多数JVM的内存使用量，堆内存仅占总数的六分之一。在这种情况下，大约44MB（垃圾收集后立即使用33MB）。非堆内存使用总量为223MB。

本机Native内存区域

压缩类空间：用于存储有关已加载的类的信息。受到约束MaxMetaspaceSize。已加载的类数的函数。
线程：JVM中线程使用的内存。正在运行的线程数的函数。
代码缓存：JIT用于存储其输出的内存。已加载的类数的函数。受到约束ReservedCodeCacheSize。可以通过调整JIT来减少，例如，禁用分层编译。
GC：存储GC使用的数据。根据使用的垃圾收集器而有所不同。
符号：存储符号，如字段名称，方法签名和实习字符串。过多的符号内存使用情况可能表明字符串过于激进。
内部：存储不适合任何其他区域的其他内部数据。

非堆内存与堆内存的不同
与堆内存相比，非堆内存在负载下不太可能发生变化。一旦应用程序加载了它将使用的所有类并且JIT完全预热，事情就会陷入稳定状态。要查看压缩类空间使用量的减少，加载类的类加载器需要进行垃圾回收。在将应用程序部署到servlet容器或应用程序服务器时，这种情况更常见 - 应用程序的类加载器将在取消部署应用程序时进行垃圾收集 - 但现代应用程序部署方法很少发生。

调整JVM的大小
配置JVM以有效利用给定数量的可用RAM并不容易。如果您启动JVM -Xmx16M并期望它最多可以使用16MB的RAM，那么您会感到非常惊讶。
调整JVM大小的一个有趣的方面是JIT的代码缓存。默认情况下，HotSpot JVM最多可使用240MB。如果代码缓存太小，JIT将耗尽空间来存储其输出，因此性能将受到影响。如果缓存太大，可能会浪费内存。在调整代码缓存大小时，查看应用程序内存使用情况及其性能的影响非常重要。
在Docker容器中运行时，Java的最新版本现在知道容器的内存限制并尝试相应地调整JVM的大小。不幸的是，这种大小调整经常过度分配非堆内存并且分配不足。假设您有一个在具有2个CPU和512MB可用内存的容器中运行的应用程序。您希望它能够处理更多负载，因此您将CPU加倍为4，将内存加倍至1GB。如上所述，堆使用通常根据负载而变化，而非堆使用则更少。因此，我们希望将大部分额外的512MB内存提供给堆来应对增加的负载。不幸的是，JVM默认情况下不会这样做，并且会在其堆和非堆区域之间更均等地分配额外的内存。
值得庆幸的是，CloudFoundry团队拥有丰富的JVM内存占用知识。如果您要将应用程序推送到CloudFoundry，构建包将自动为您应用此知识。如果您没有使用CloudFoudry，或者您想了解有关如何调整JVM大小的更多信息，那么Java buildpack内存计算器第三版的[url=https://docs.google.com/document/d/1vlXBiwRIjwiVcbvUGYMrxx2Aw1RVAtxq3iuZ3UK2vXA/edit?usp=sharing]设计文档[/url]提供了一些强烈建议的进一步阅读。

这对Spring来说意味着什么？
考虑到堆和非堆内存使用情况，我们花了很多时间在Spring团队中考虑性能和内存利用率。限制非堆内存使用的一种方法是使Framework的一部分尽可能通用。这方面的一个例子是使用反射来创建应用程序的bean并将其注入到应用程序的bean中。由于使用了反射，所使用的Framework代码量保持不变，无论应用程序包含多少bean。我们使用基于堆的缓存来优化启动时间，一旦启动完成就清除此缓存。然后，垃圾收集器可以轻松地回收堆内存，从而在应用程序处理其工作负载时为应用程序提供尽可能多的内存。