java虚拟机运行时数据区域

进程和线程

  这里必须先提一下操作系统的进程和线程。

什么是进程?

  在操作系统中每一个独立的程序单元就是一个进程。每个进程都有相互隔离的内存空间(显然,不然一些流氓进程就可以访问网上银行账号密码等之类的敏感数据了),因此进程之间通信极其不容易。

什么是线程?

  线程是进程里面的执行流,每个线程都有自己的程序栈,也有自己TLS,独立的线程私有空间,由于线程是进程里面的一部分,那么线程也可以访问公有内存,线程也有自己私有的空间。因此线程之间的信息交流会非常方便。

线程与进程的关系。

  线程是真正的程序执行流,每个程序由一个主线程和多个子线程一起运行工作完成的,因此线程才是真正的程序运行的东东,而进程相当于一个容器,这个容器给线程提供了相对隔离的内存空间,和一个相对安全的访问条件。

jvm 的运行数据分布

  了解了一下进程和线程后。我们看看虚拟机的内存分布。

程序计数器

  程序计数器:是jvm中一小块内存空间,可以当做当前线程的字节码文件的行号,字节码解释器通过改变这个值来获取下一个指令。Java多线程通过线程轮流切换处理器的执行时间来执行的,大家知道现代处理器的原理,每次一个核上只能一个线程进行运转,由于中断,当线程切换后能恢复到原先正确的位置。因此每个程序计数器都是独立的,这些程序计数器的所在的内存称为线程私有的内存。如果线程执行的是java方法,那么程序计数器指代的是当前字节码指令的地址,如果是native方法,程序计数器的值为空,这处区域是jvm没有定义OutOfMemoryError错误。就是放代码的地方,通过操作这个栈,来执行这个代码。

虚拟机栈

  打个比方,一般吧java内存粗略分为堆栈,这个虚拟机栈中的局部变量表就是传说中的栈,线程私有的,描述java方法执行的内存模型:每个方法在执行的时候都会建立一个这个;用于存储局部变量表,操作数栈,动态链接,方法出口等,每一个方法从调用到执行完,就代表一个栈帧在虚拟机栈中从入栈到出栈的过程,其中局部变量表存放了编译器可知的基本变量(boolean,int,double,float,char),还有引用类型(),renturnAddress类型(指向了一个字节码的地址)局部变量表的大小信息在编译期间就确定好了,运行期间不会改变其大小,该虚拟机栈回报2个错误,第一个就是请求的栈帧大于虚拟机栈的深度回报StackOverflowError错误第二个错误就是虚拟机栈动态扩张,扩张到无法申请到内存时报OutOfMemoryError错误。

本地方法栈

  和虚拟机栈差不多,不过不是java方法是native方法,java规范对native方法的语言和数据格式没有强制要求虚拟机可以自由的去实现它,报的错误也是StackOverflowError错误和OutOfMemoryError错误.

Java堆:

  第一它是所有线程共享的,虚拟机启动创建堆,主要用于存储对象实例和数组,Java垃圾处理器主要处理的就是java堆,因此java堆也被称为gc堆,从内存回收的角度上讲可以划分为新生代和老生代,从内存分配角度讲,可以划分出多个线程私有的内存区域等,java堆有多种划分方式,但是无论怎么划分都是存储对象实例,多重划分是为了更好的划分内存和回收内存,java堆可以位于内存上不连续的空间上,只要逻辑上连续即可,java堆可以实现为固定大小的,也可以实现为可扩展大小的,要是java堆上无法为实例对象分配内存,那么就会报这个OutOfMemoryError.
  堆划分为新生代,老年代,默认比例为1:2,新生代划分为3个区域,eden,From survivor,to survivor,比例为8:1:1。为何呢。参照下面:IBM研究发现,98%的新生态对象生存周期很短的,于是一个新的算法出来了,就是把内存分为3部分,8:1:1,每次使用其中的0.9部分,当发生垃圾回收的时候那就把剩余的对象就放到剩余的0.1那里,当然剩余的0.1可能不够那就可以把一部分对象转化为老年态暂时存到老年态里面,这样子就只浪费0.1的内存了,性价比可以。
  参数设定:新生代和老年代的比例–XX:NewRatio. 新生代中,eden,from,to的参数为–XX:SurvivorRatio。

方法区:

  各个线程共享的区域,主要存储被虚拟机加载的类信息,常量,静态变量,编译器编译后的代码,和java堆一样逻辑上内存,可扩展的实现大小,这个区域的垃圾回收主要针对常量池的回收和类型的卸载,其中类型的卸载要求比较高,但是必要的垃圾回收是必要的,以前低版本的就出现过严重的内存泄漏。

运行期常量池:

  这个区域也是方法区的一部分,编译后的Class文件中的类名啊,方法名啊,常量啊被加载到虚拟机后就会放到方法去的运行常量池来保存,当然常量不止可以只是在编译期间放到常量池中,还可以用string.intern()方法(如果常量池中存在当前字符串, 就会直接返回当前字符串. 如果常量池中没有此字符串, 会将此字符串放入常量池中后, 再返回)来在运行期间放到常量池中,当然要是常量池中无法申请到内存时就会报出OutOfMemoryError这个经典错误。

直接内存

  直接内存是一个重要的问题,首先它不是运行数据区的部分也不是java虚拟机规范的一部分,这个的出现主要和java1.4后出现的NIO相关,一个基于通道和缓冲区的io方式,它可以使用Native函数库来直接分配堆外内存,然后通过一个存在java堆中的DirectByteBuffer这个对象来对这个java堆外的内存的引用来进行操作,可以提高相关性能,因为避免了java堆和native堆中的来回复制数据。
  那个那么重点来了,既然这个直接内存不归java堆管理,但是也会受到总内存的限制,如果管理员设置课动态扩展的javajvm时,如果忽略了这个直接内存的,最后实际内存总和大于实际内存,当jvm要动态扩展内存时,就会出现这个outofmemoryerror错误。

启动参数配置

  -Xms :初始堆大小 物理内存的1/64(<1GB) 默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时,JVM就会增大堆直到-Xmx的最大限制.

  -Xmx:最大堆大小 物理内存的1/4(<1GB) 默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时,JVM会减少堆直到 -Xms的最小限制.

  -Xmn 年轻代大小(1.4or lator)
注意:此处的大小是(eden+ 2 survivor space).与jmap -heap中显示的New gen是不同的。整个堆大小=年轻代大小 + 年老代大小 + 持久代大小.增大年轻代后,将会减小年老代大小.此值对系统性能影响较大,Sun官方推荐配置为整个堆的3/8.

  -XX:PermSize 设置持久代(perm gen)初始值.

  -Xss 每个线程的堆栈大小 JDK5.0以后每个线程堆栈大小为1M,以前每个线程堆栈大小为256K.更具应用的线程所需内存大小进行 调整.在相同物理内存下,减小这个值能生成更多的线程.但是操作系统对一个进程内的线程数还是有限制的,不能无限生成,经验值在3000~5000左右,一般小的应用, 如果栈不是很深, 应该是128k够用的 大的应用建议使用256k。这个选项对性能影响比较大,需要严格的测试。(校长)