13 | Java内存模型
13 | Java内存模型
讲述:郑雨迪
时长13:46大小6.30M
Java 内存模型与 happens-before 关系
Java 内存模型的底层实现
锁,volatile 字段,final 字段与安全发布
总结与实践
赞 9
提建议
精选留言(69)
- 大场镇车王置顶2018-08-20老师 为什么volatile内存屏障不允许所有写操作之前的读操作被重排序到写操作之后?前面不是说volatile的写操作happens before对用一字段的读操作吗
作者回复: volatile字段的happens-before关系指的是在两个不同线程中,volatile的写操作 happens-before 之后对同一字段的读操作。这里有个关键字之后,指的是时间上的先后。也就是我这边写,你之后再读就一定能读得到我刚刚写的值。普通字段则没有这个保证。 屏障不允许重排序是针对即时编译器的。写后对同一字段的读,属于数据依赖,本来也不可以重排序的。
共 4 条评论27 - 黑崽置顶2018-08-22请教个问题。刚才有说不会把volatile放到寄存器,但是应该会在栈里面对吧。直接读取主内存,读写的是栈数据,然后利用堆内存和栈上数据是利用写缓存刷新同步的?
作者回复: 我可能没有在原文中讲清楚。这里指的是volatile变量不能被分配到寄存器中,但是计算还是加载到寄存器中来计算的。 所谓的分配到寄存器中,你可以理解为编译器将内存中的值缓存在寄存器中,之后一直用访问寄存器来代表对这个内存的访问的。假设我们要遍历一个数组,数组的长度是内存中的值。由于我们每次循环都要比较一次,因此编译器决定把它放在寄存器中,免得每次比较都要读一次内存。对于会更改的内存值,编译器也可以先缓存至寄存器,最后更新回内存即可。 Volatile会禁止上述优化。
共 7 条评论25 - Alex Rao置顶2018-08-20老师,我在一些技术文章里看到说 volatile 的变量是存在工作内存,这个工作内存是一个什么概念?
作者回复: 工作内存是JMM抽象出来的一个概念。你可以映射到实际的CPU缓存。
14 - 加多置顶2018-08-20老师,求讲解下jvm中代码如何实现的内存屏障
作者回复: 即时编译器生成的代码里会使用CPU的内存屏障指令。HotSpot采用的lock前缀的指令,lock add DWORD PTR [rsp] 0。它也会刷缓存。 至于在即时编译器里禁止重排序所使用的”内存屏障”,就是一个特殊的编译器中间表达形式节点。
共 2 条评论10 - 小文同学置顶2018-08-20老师我提个问题。一个共享对象的变量是非volatile的,那么这个变量的写入会先写到寄存器上,再写回内存吗?那么jvm是不是无论如何都不保证啥时候变量的值会写回内存。假如另一个线程加锁访问这个变量,是不是jvm也不保证它能拿到最新数据。
作者回复: 对的!如果即时编译器把那个变量放在寄存器里维护,那么另一个线程也没辙。
共 6 条评论5 - Jerry Chan置顶2018-08-21博客在哪里啊?
作者回复: 文末[4]所指向的链接。
1 - 钱2018-08-23恩,这节听了好几遍,也读了几遍,最后还是感觉蒙蒙的。 下面说下我的感受: 1:一图胜千言,尤其对于描述复杂的东西,这个建议其他同学也有提议的,希望雨迪采纳一下 2:感觉有些概念没有解释,比如: 2-1:Java内存模型,这节不就是要讲Java内存类型是什么?有什么特点?为什么这么设计嘛?不过我没看到这些内容,当然,特点是讲了的 happens-before 机制 2-2:内存屏蔽,这是什么意思?它怎么就能禁止重排序啦?还有有其引申出的各种屏蔽是怎么回事呢?也没完全明白 3:前面讲 as-if-serial 大概明白什么意思了,多处理器为了提高效率会采用流水线的方式来执行程序指令,但是同时要保证程序执行逻辑的正确性,所以,实际执行程序的指令和代码层面上会有不同,这个是由编译器来保证的,虽然执行逻辑不同但是程序逻辑是没变的,单线程没问题,但是多线程就变得复杂一些了,光靠这种方式保证不了啦,所以引出了下文 4:happens-before,这个概念和作用比较容易理解,线程内有这种关系,线程间更有,这个机制我认为就是为了多线程环境下为了保证程序逻辑正确性的一种方式,不过它的具体实现细节感觉没理解,不清楚他是怎么办到的 5:volatile 这个关键字之前也学习过,作用是保证内容的修改对所有线程可见,原理是修改后同步更新所有的内容,这是因为内存和处理器直接还是存在距离的,比如:内存-一级缓存-二级缓存-各种寄存器-cpu,如果是内存-cpu,则不会有这种问题了,不过性能也就不行了展开共 5 条评论60
- 素丶2018-11-20可以配合程晓明大大的《深入理解Java内存模型》 https://www.infoq.cn/article/java_memory_model共 2 条评论34
- 道法自然2018-08-24老师你好,关于指令重排序有点不太理解,指令重排序的粒度是方法级别的,还是整个源文件级别的。文中说道,b 加了volatile后,能够保证 b=1 先于r1=b ,这个我能理解,但是如何保证不会因为指令重排导致 b=1 先于r2=a发生呢?文中虽然说了,同一个线程中,字节码顺序暗含了r2=a happen before b=1,但是文中也提到了,拥有happen-before关系的两对赋值操作之间没有数据依赖,处理器可以指令重排序。r2=a 和b=1之间没有数据依赖呀!不好意思,这块有点迷糊,老师能给详细解答下不?展开
作者回复: 首先,b加了volatile之后,并不能保证b=1一定先于r1=b,而是保证r1=b始终能够看到b的最新值。比如说b=1;b=2,之后在另一个CPU上执行r1=b,那么r1会被赋值为2。如果先执行r1=b,然后在另外一个CPU上执行b=1和b=2,那么r1将看到b=1之前的值。 在没有标记volatile的时候,同一线程中,r2=a和b=1存在happens before关系,但因为没有数据依赖可以重排列。一旦标记了volatile,即时编译器和CPU需要考虑到多线程happens-before关系,因此不能自由地重排序。
24 - Kyle2018-08-25我个人理解的“JAVA内存模型”应该是包括两部分的内容: 一是运行时数据区, 二是定义了一组内存访问规则。 这里其实主要讲的是其中的第二部分内容。不知道是不是可以这样总结。
作者回复: 谢谢总结!确实,本文重点讲的是内存可见性规则。 JMM的工作内存,主内存这些概念都是抽象的,对应实际体系架构中的缓存和内存。本文切掉了抽象的那部分,直接用实际的体系架构来讲解。
9 - 阿巍-豆夫2018-12-03关于Volatile, 我想问下,如果是单个cpu的系统上运行多线程的程序,是不是这个volative就没有效果了? 因为大家都使用同一个寄存器。
作者回复: 理论上,因为都使用同一套缓存,所以不需要volatile。实际实现中,对编译器不能重排列的限制还是存在的,但具体的memory barrier指令的实现是no-op。
8 - 第9根烟2018-10-24问一下,内存屏障是即时编译器生成本地代码的时候产生的??那照这个意思岂不是关闭即时编译器就实现不了happen-before原则了?
作者回复: 在解释执行时,字节码之间也有内存屏障
共 2 条评论5 - 西门吹牛2020-07-14如何理解编译优化: 经过编译后的指令,最终是要被cpu执行。cpu 指令执行是采用流水作业的方式,一条指令的执行流程包含取得指令、指令译码、执行指令三个过程。cpu可以一次取一条指令,也可以一次取一个指令包,指令包包含多条执行。而cpu执行指令的时候,并不是等一条指令执行结束在执行下一条指令,往往一条 cpu 指令会被拆分成多个阶段,多个阶段就对应多个流水线。也就是说只要保证一条指令的多个流水线只要在一个cpu时钟周期内完成即可。这就会导致一条指令的数据操作好没写回内存,下一条指令已经开始工作,因此下一条指令读取的数据,不一定是上一条指令执行后的数据。编译优化的目的本质是加快程序运行速度,能让编译后的指令尽可能赶上cpu的执行频率。这种cpu指令的流水线作业,就导致,程序编译后的指令,实际执行的顺序可能不是严格按照编译后的指令顺序而执行。 在单线程执行的时候或者单核执行的时候,cpu在执行有数据依赖的指令的时候,往往通过加入一些空操作no-op来保证指令的执行顺序,对于没有数据依赖的指令,往往采用乱序执行来加快执行效率。 在多线程的情况下或者多核的情况下,对数据操作是并发执行,也就是说,每个线程都会把操作的数据加载到自己的缓存中(本地内存)执行,这就导致,线程之间对数据的操作不可见。java内存模型规定,要保证数据的可见性,必须经过主内存,也就是说,只有当一个线程的操作同步到主内存后,别的线程才能读到更新后的数据。在多线程下,对共享变量操作就会发生数据竞争问题,从而导致并发问题; 如何理解内存屏障禁止指令重排序: 在单线程的情况下,JMM规定了一条HB 规则,在一个线程中,前面的操作 Happens-Before 于后续的任意操作,这就要求,在cpu指令执行的时候,有数据依赖关系的指令,不能被重排序,但是CPU执行指令的时候,为了执行效率采用流水作业,并不是严格按照程序的顺序进行执行。这就要求,在有依赖关系的指令之间插入内存屏障来保证,比如插入空操作no-op,这就保证了,如果写操作指令没有执行完,这是读指令读取数据,那么读取的是内存屏障指令,也就是空操作,只有等写操作指令执行结束,读指令才能读取到最新的数据。从而解决了编译重排序而导致的数据安全问题; 在多线程的情况下,为了解决线程之间缓存导致的可见性问题,JMM规定了一条HB规则,对一个 volatile 变量的写操作Happens-Before 于后续对这个 volatile 变量的读操作。比如 A 线程对变量执行写操作,这时候,B线程想要在A线程写完之后读取数据,因为A 线程的写操作,往往需要多条cpu指令执行,如果写操作的指令还没执行结束,这时候读指令读取到的数据必然是不符合程序本身意愿的。A线程写操作的指令和B线程读操作的指令,在CPU执行的时候,先后顺序完全取决于CPU,CPU不会等A线程写操作指令执行完才执行B线程的读操作指令,这就会引起并发问题,这时候可以通过内存屏障来解决,也就是对共享变量用volatile 修饰,volatile 本质就是通过内存屏障来实现,也就是说用volatile修饰变量,编译后,会生成具体的每次屏障指令,以Lock开头的指令,就是保住A线程对数据的操作结果,会同步到内存中,并且在A线程执行写操作的时候,B线程不可以进行读取操作,只有当A的写操作同步到内存后,B线程才执行度操作,类似锁的功能。通过内存屏障禁止了指令重排序,保证了共享数据在多线程之间的可见性问题。展开4
- Mr.钧👻2018-10-20即时编译在单线程的情况下,根据as if serial 的选择,会是的编译逻辑和程序逻辑相同。 但是,在多线程情况下可能出现编译器重排序导致的数据竞争。这时就需要使用volatile来禁止重排序。 volatile的底层原理,是在字节码中插入内存屏障实现的。 内存屏障会被转化成一条指令,指令具体的效果是强制刷新缓存。 疑问:为什么是强制刷新缓存?是因为happen-before原则,要让后面的程序看到? 那后面程序看到的就是缓存中的内容吗? 我对寄存器,缓存有不熟悉的地方,希望老师可以指正,指导我该补哪方面的知识,多谢展开
作者回复: 我们考虑一种简单情况,即每个CPU有独占缓存,没有共享缓存。强制刷新缓存,是为了让跑在另外一个CPU上的线程看到你这个CPU上更新的内容。 如果想要深入研究下去,可以翻翻CSAPP那本书。
4 - Kenneth2018-08-30同求讲解该问题,谢谢老师!: 啃yi嘴泥 老师你好,关于指令重排序有点不太理解,指令重排序的粒度是方法级别的,还是整个源文件级别的。文中说道,b 加了volatile后,能够保证 b=1 先于r1=b ,这个我能理解,但是如何保证不会因为指令重排导致 b=1 先于r2=a发生呢?文中虽然说了,同一个线程中,字节码顺序暗含了r2=a happen before b=1,但是文中也提到了,拥有happen-before关系的两对赋值操作之间没有数据依赖,处理器可以指令重排序。r2=a 和b=1之间没有数据依赖呀!不好意思,这块有点迷糊,老师能给详细解答下不? 2018-08-24展开
作者回复: 嗯,我回到原问题上哈
共 2 条评论3 - 昵称而已,何必执着2018-09-17我写了个方法按照上面的代码循环执行了9999次,要么是1,0要么是0,2 一直没有出现1,2。这个怎么破?
作者回复: 你需要用jcstress工具来进行压力测试。 如果跑自己写的程序的话,可以试试在电脑上跑多个满载进程,让操作系统不停切换进程。
2 - 浩2018-09-03您好 当工作线程需要的内存特别大 比如超过10m 那工作线程会copy10m的内存数据到工作线程嘛?
作者回复: JMM里的工作内存是个虚拟概念,实际上映射到的是CPU缓存。 如果你指工作线程会不会将用到的内存加载至CPU缓存中,那么答案是会的。 如果你指会不会另外开一片内存,来存储这部分用到的堆内存,那么答案是不会的。
2 - xzy2020-11-12JMM 决定一个 线程对共享变量的写入何时对另一个线程可见。1
- Monday2020-07-08以往我认为b设置为volatile后,如代码:标记1则不能重排序优化到标记2后面,若r1=1,则表明顺序肯定能确定有 1,2,3;但是4若在最前面执行了,则可能出现(r1,r2)=(1,2)。 但是现在这个假设已经被老师打破了,而且是我所不能理解了,我太难了...... 能不能这样理解,b设置为volatile后,对b的赋值和读取都加了重排序限制,导致1 happen-before 2, 3 happen-before 4。 int a=0; volatile int b=0; public void method1() { int r2 = a; //标记1 b = 1; //标记2 } public void method2() { int r1 = b; //标记3 a = 2; //标记4 }展开1
- 长脖子树2019-11-06测试用例 [6] 中实际测试后会发现, 有一部分的 object 尚未初始化 问题出在 new 操作上,我们以为的 new 操作应该是: 分配一块内存 M;在内存 M 上初始化 Singleton 对象;然后 M 的地址赋值给 instance 变量。 但是实际上优化后的执行路径却是这样的: 分配一块内存 M;将 M 的地址赋值给 instance 变量;最后在内存 M 上初始化 Singleton 对象。 所谓的单例模式, 就是安全发布的问题 (部分来自专栏 java并发编程实战)展开1