HotSpot虚拟机对象探秘

大负翁 發表於 2025-7-29 23:40:00

<h1 id="hotspot虚拟机对象探秘">HotSpot虚拟机对象探秘</h1>
<p>HotSpot虚拟机在Java堆中的对象分配、布局和访问。</p>
<h2 id="对象的创建">对象的创建</h2>
<pre><code class="language-bash">如何划分可用空间。
并发下指针分配的安全问题。
</code></pre>
<p>普通Java对象、数组对象和Class对象。此处只讨论普通Java对象。</p>
<h3 id="使用new关键字创建对象在虚拟机中这是怎样的一个过程">使用new关键字创建对象，在虚拟机中，这是怎样的一个过程？</h3>
<p>当Java虚拟机遇到一条字节码new指令时，首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用。并检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有，则先执行相应的类加载过程。</p>
<p>类加载检查通过后，虚拟机将为新生对象分配内存。对象所需内存的大小在类加载完成后便可完全确定。</p>
<p>为对象分配空间的任务实际上等同于把一块确定大小的内存块从Java堆中划分出来。</p>
<ul>
<li>分配方式
<ul>
<li>指针碰撞</li>
</ul>
</li>
</ul>
<p>假设Java堆中的内存是绝对规整。</p>
<ul>
<li>空闲列表</li>
</ul>
<p>维护一个列表，记录哪些内存块是可用的。</p>
<p>选择哪种分配方式由Java堆是否规整决定。</p>
<p>Java堆是否规整由所采用的垃圾收集器是否带有空间压缩整理（Compact）的能力决定。</p>
<p>当使用Serial、ParNew等带压缩整理过程的收集器时，系统采用的分配算法是指针碰撞。</p>
<p>当使用CMS这种基于清除（Sweep）算法的收集器时，理论上就只能采用较为复杂的空闲列表来分配内存。</p>
<ul>
<li>如何保障并发内存分配的线程安全</li>
</ul>
<p>有两种可选方案：</p>
<ol>
<li>对分配内存空间的动作进行同步处理。实际上虚拟机是采用CAS配上失败重试的方式保证更新操作的原子性。</li>
<li>把内存分配的动作按照线程划分在不同的空间之中进行，即每个线程在Java堆中预先分配一小块内存，称为本地线程分配缓冲（Thread Local Allocation Buffer， TLAB），哪个线程要分配内存，就在哪个线程的本地缓冲区中分配，只有本地缓冲区用完了，分配新的缓存区时才需要同步锁定。</li>
</ol>
<ul>
<li>设置零值</li>
</ul>
<p>内存分配完成之后，虚拟机将分配到的内存空间（不包括对象头）都初始化为零值。</p>
<p>如果使用了TLAB，这一项工作可以提前到TLAB分配时顺便进行。</p>
<p>这步操作保证了对象的实例字段在Java代码中，可以不赋初始值就直接使用，使程序能访问到这些字段的数据类型所对应的零值。</p>
<ul>
<li>进行必要的设置</li>
</ul>
<p>Java虚拟机对对象进行必要的设置</p>
<pre><code class="language-bash">对象是哪个类的实例
如何找到类的元数据信息
对象的哈希码
对象的GC分代年龄信息
</code></pre>
<p>这些信息存放在对象的对象头（Object Header）之中。根据虚拟机当前运行状态的不同，如是否启用偏向锁等，对象头会有不同的设置方式。</p>
<p>上面的工作都完成之后，从虚拟机视角来看，一个新的对象已经产生了。</p>
<p>从Java程序的的视角看来，对象的创建才刚开始。new指令之后执行<init>()方法，按照程序员意愿对对象进行初始化，这样一个真正可用的对象才算完全被构造出来。</init></p>
<h2 id="对象的内存布局">对象的内存布局</h2>
<p>在HotSpot虚拟机里，对象在堆内存中的存储布局可以划分为三个部分：</p>
<p>对象头（Header）</p>
<p>实例数据（Instance Data）</p>
<p>对齐填充（Padding）</p>
<h3 id="对象头">对象头</h3>
<p>包含两类信息：</p>
<p>第一类，用于存储对象自身的运行时数据。哈希码（HashCode）、GC分代年龄、锁状态标志、线程持有锁、偏向线程ID、偏向时间戳等。这部分数据的长度在32位和64位的虚拟机（未开启压缩指针）中分别为32个比特和64个比特，官方称它为"Mark Word"。</p>
<p>Mark Work被设计为一个有着动态定义的数据结构，以便在极小的空间内存储尽量多的数据，根据对象的状态，复用自己的存储空间。</p>
<p>有如下五种状态：未锁定、轻量级锁定、重量级锁定、GC标记、可偏向。根据状态不同，用不同的比特位控制不同的存储内容。</p>
<p>第二类，类型指针。对象指向它的类型的元数据指针，Java虚拟机通过这个指针来确定该对象是哪个类的实例。</p>
<p>并不是所有虚拟机实现都必须在对象数据上保留类型指针，即查找对象的元数据信息，不一定要经过对象本身。</p>
<p>如果对象是一个数组，对象头中还必须有一块用于记录数组长度的数据。虚拟机可以通过普通Java对象的元数据信息确定Java对象的大小，如果数组的长度是不确定的，将无法通过元数据信息推断数组的大小。</p>
<h3 id="实例数据">实例数据</h3>
<p>实例数据部分是对象真正存储的有效信息。</p>
<p>我们在程序代码里定义的各种类型的字段内容。无论是从父类继承的，还是子类中定义的字段，都必须记录起来。</p>
<p>这部分的存储顺序，会受到虚拟机分配策略参数（-XX: FieldAllocationStyle参数）和字段在Java源码中定义顺序的影响。</p>
<p>相同宽度的字段总是被分配到一起存放。</p>
<h3 id="对齐填充">对齐填充</h3>
<p>并非必然存在，仅起着占位符的作用。</p>
<p>HotSpot虚拟机的内存管理系统，要求对象的起始地址，必须是8字节的整数倍，即任何对象的大小都必须是8字节的整数倍。</p>
<p>对象头已经被精心设计成正好是8字节的倍数（1倍或者2倍）。</p>
<p>对象实例数据如果没有对齐的话，需要通过对齐填充补全。</p>
<h2 id="对象的访问定位">对象的访问定位</h2>
<p>Java程序会通过栈上的reference数据来操作堆上的具体对象。</p>
<p>访问方式有两种：</p>
<ol>
<li>句柄</li>
<li>直接指针</li>
</ol>
<h3 id="句柄">句柄</h3>
<p>使用句柄访问，Java堆中将划出一块内存来作为句柄池。reference中存储的就是对象的句柄地址，而句柄中包含了对象实例数据与类型数据各自具体的地址信息。</p>
<h3 id="直接指针">直接指针</h3>
<p>使用直接指针访问，Java堆中对象的内存布局，必须考虑如何放置访问类型数据的相关信息，reference中存储的直接就是对象地址，如果只是访问对象本身，不需要多一次间接访问的开销。</p>
<p>优点：速度快，节省一次指针定位的时间开销。hotSpot主要采用该方式进行访问。</p><br><br>
来源：https://www.cnblogs.com/biby/p/19012042

頁: [1]

圆梦公社's Archiver

HotSpot虚拟机对象探秘