Java中getAcquire/setRelease不如volatile更安全

getAcquire与setRelease：你以为的“安全”其实是“裸奔”

在Java并发编程的世界里，getAcquire和setRelease这对组合听起来就像是某种高端安全协议，仿佛只要用了它们，你的程序就能自动获得“线程安全认证”，从此高枕无忧。

但真相是，它们更像是健身房里那种只练胸肌不练核心的健身爱好者——表面看起来很强壮，实际上一跑步就扭伤腰。

根据Javadoc的官方描述：

getAcquire的作用是“返回变量的值，并确保后续的加载和存储不会被重排序到该操作之前”
而setRelease则是“设置变量的值，并确保之前的加载和存储不会被重排序到该操作之后”。

听起来是不是特别严谨？就像法律条文一样滴水不漏？

可惜，现实远比文档残酷。

这些所谓的“内存屏障”其实只是单向的篱笆，上面长满了倒刺，阻止操作越过边界，但仅限一个方向。

你可以把getAcquire想象成一个向下长满倒刺的栅栏，后面的指令不能跑到它前面去，但它前面的指令却可以随意往后跳；

同理，setRelease就像一个向上长刺的篱笆，前面的操作不能越界到后面，但后面的操作却能自由前插。

这种设计看似合理，实则埋下了巨大的隐患——因为它允许某些关键操作在特定情况下“偷偷换位”，就像考试时两个学生悄悄交换了答题卡，监考老师却只盯着其中一个方向。

举个例子，假设线程A执行完一堆复杂计算后，用setRelease(true)标记一个done标志，而线程B通过getAcquire()读取这个标志，一旦发现为真，就认为所有准备工作已完成，可以放心使用相关数据。

这听起来很合理，对吧？

但实际上，如果没有更严格的同步机制，编译器或CPU可能会把state = initialize()这行代码挪到done.setRelease(true)之后，导致线程B看到done为真时，state仍然是null。

这种情况在x86架构上可能碰巧运行正常，因为Intel的内存模型相对较强，重排序行为较少，但在ARM这种弱内存序架构上，程序随时可能崩溃，而且崩溃的方式还特别随机，就像你每次重启电脑都有50%的概率蓝屏，完全无法预测。

更讽刺的是，很多开发者在x86机器上测试时一切正常，于是自信满满地把代码部署到移动端或服务器集群，结果一上线就炸得片甲不留。这就像一个人在沙漠里学会了游泳，以为自己能在海里横着走，结果第一次下海就被浪拍晕了。

volatile读写：真正的“全副武装”还是“过度防护”？

如果说getAcquire和setRelease是半吊子保安，那volatile读写就是穿着防弹衣、头戴钢盔、手持金属探测器的顶级安保团队。

它不仅具备getAcquire和setRelease的所有功能，还额外提供了一项关键保障：整个程序的执行必须能被解释为某种全局顺序，也就是说，所有线程看到的volatile变量修改顺序必须一致，并且符合代码中的逻辑顺序。

这听起来是不是有点像“因果律武器”？没错，正是这种特性，让volatile能够阻止那些看似荒谬但实际上完全合法的重排序行为。

比如在前面提到的ReleaseAcquireRace例子中，两个线程分别设置自己的启动标志，然后检查对方是否已启动，如果没有，就宣布自己是第一个。按常理推断，最多只能有一个线程获胜，要么是线程1，要么是线程2，或者两者同时开始导致平局。但如果你使用的是getAcquire和setRelease，你会发现运行一段时间后，竟然出现了“两个线程都觉得自己赢了”的诡异情况。这就好比两辆车在十字路口同时亮起左转灯，按理说应该有一方让行，结果它们都坚信对方看到了自己打灯，于是同时转弯，最终撞了个满怀。

为什么会这样？

原因就在于setRelease和getAcquire之间的操作可以被重排序。线程1可能先执行了started1.setRelease(true)，但紧接着的started2.getAcquire()却被提前执行了，导致它误判对方还没启动，于是自信满满地标记first1 = true；与此同时，线程2也经历了同样的过程，结果就是双方都觉得自己赢了。

这种现象在Intel的开发者手册中甚至被明确提及，说明这不是bug，而是硬件层面允许的行为。

要解决这个问题，你可以在setRelease和getAcquire之间插入一个VarHandle.fullFence()，强制禁止任何重排序，或者干脆改用volatile语义，让JVM自动帮你处理这一切。

然而，讽刺的是，很多开发者明明知道volatile更安全，却因为“性能优化”的执念，执意使用getAcquire和setRelease，结果省下的那点CPU周期，远远抵不上线上故障带来的损失。这就像是为了省几块钱打车费，宁愿步行十公里，结果路上摔了一跤，进了医院花了几万块。

Peterson算法：理论上的完美与现实中的尴尬

接下来，让我们聊聊一个在教科书里闪闪发光，但在实际项目中几乎没人敢用的算法——Peterson算法。这个算法的初衷是实现两个线程之间的互斥访问，而且不依赖现代CPU提供的原子CAS（Compare-and-Swap）指令，完全靠volatile变量和巧妙的逻辑来达成目的。

听起来是不是很酷？就像是不用枪炮也能打赢战争的古代兵法大师。

然而，它的优雅背后隐藏着极其脆弱的平衡。在Peterson算法中，每个线程进入临界区前，必须先声明自己感兴趣（interested[myIdx] = 1），然后主动把“让行权”交给对方（turn = oIdx），最后进入循环等待，直到对方不再感兴趣或轮到自己为止。

这个逻辑看似无懈可击，但如果使用的不是volatile读写，而是getAcquire和setRelease，整个算法就会瞬间崩塌。

问题出在第一步和第二步之间——由于setRelease不禁止后续操作的重排序，turn = oIdx这一行可能被提前执行，导致两个线程同时认为对方应该让行，结果双双闯入临界区，造成严重的数据竞争。

这就好比两个司机在窄桥上相遇，按照规则，一方应先退后让行，但他们都没等对方完全停下就抢先开进，最终在桥中央堵死。

更讽刺的是，Peterson算法虽然在理论上证明了“仅靠内存可见性就能实现互斥”，但在现实中，几乎所有主流锁实现都直接采用了硬件级的CAS操作，性能远超Peterson算法。

这就像是科学家费尽心思发明了一种不用电的冰箱，结果发现制冷效果还不如老式的冰柜，唯一的亮点是“理论上可行”。

不过，Peterson算法的价值并不在于实用性，而在于它清晰地揭示了volatile语义的重要性——它不仅仅是为了保证可见性，更是为了维护操作的全局顺序一致性。一旦失去这一点，再精巧的算法也会变成纸糊的堡垒，风一吹就倒。

性能之争：x86与ARM的“南北战争”

最后，我们来谈谈性能。

很多开发者选择getAcquire和setRelease的理由是“更轻量”，认为volatile会带来额外开销。

但实际情况远比想象复杂。

在我的测试中，ACQUIRE_RELEASE加显式内存屏障的版本在x86笔记本上略胜一筹，而在ARM设备上，直接使用volatile反而表现更好。

这说明不同架构对内存屏障的处理方式存在显著差异，而JVM的优化策略也会因平台而异。

因此，所谓的“性能优化”很可能只是“盲人摸象”式的局部改进，甚至可能适得其反。与其花时间微调这些底层细节，不如先确保程序的正确性。毕竟，一个跑得快但结果错误的程序，还不如干脆卡死。

Java中getAcquire/setRelease不如volatile更安全

什么是Context上下文？

抽象两种方法：上下文与类型

Content与Context一字之差暗藏逆天极道

语境崩塌：你的注意力正被劫持

Context逻辑之道