Java虛擬機底層原理和流程,看懂你就掌握60%JVM
作為一名Java使用者,掌握JVM的體系結(jié)構(gòu)也是必須的。
說起Java,人們首先想到的是Java編程語言,然而事實上,Java是一種技術(shù),它由四方面組成:Java編程語言、Java類文件格式、Java虛擬機和Java應用程序接口(Java API)。它們的關系如下圖所示:

運行期環(huán)境代表著Java平臺,開發(fā)人員編寫Java代碼(.java文件),然后將之編譯成字節(jié)碼(.class文件),再然后字節(jié)碼被裝入內(nèi)存,一旦字節(jié)碼進入虛擬機,它就會被解釋器解釋執(zhí)行,或者是被即時代碼發(fā)生器有選擇的轉(zhuǎn)換成機器碼執(zhí)行。
Java平臺由Java虛擬機和Java應用程序接口搭建,Java語言則是進入這個平臺的通道,用Java語言編寫并編譯的程序可以運行在這個平臺上。這個平臺的結(jié)構(gòu)如下圖所示:

在Java平臺的結(jié)構(gòu)中, 可以看出,Java虛擬機(JVM) 處在核心的位置,是程序與底層操作系統(tǒng)和硬件無關的關鍵。它的下方是移植接口,移植接口由兩部分組成:適配器和Java操作系統(tǒng), 其中依賴于平臺的部分稱為適配器;JVM 通過移植接口在具體的平臺和操作系統(tǒng)上實現(xiàn);在JVM 的上方是Java的基本類庫和擴展類庫以及它們的API, 利用Java API編寫的應用程序(application) 和小程序(Java applet) 可以在任何Java平臺上運行而無需考慮底層平臺, 就是因為有Java虛擬機(JVM)實現(xiàn)了程序與操作系統(tǒng)的分離,從而實現(xiàn)了Java 的平臺無關性。
JVM在它的生存周期中有一個明確的任務,那就是運行Java程序,因此當Java程序啟動的時候,就產(chǎn)生JVM的一個實例;當程序運行結(jié)束的時候,該實例也跟著消失了。下面我們從JVM的體系結(jié)構(gòu)和它的運行過程這兩個方面來對它進行比較深入的研究。
1、Java虛擬機的體系結(jié)構(gòu)
- 每個JVM都有兩種機制:
①類裝載子系統(tǒng):裝載具有適合名稱的類或接口
②執(zhí)行引擎:負責執(zhí)行包含在已裝載的類或接口中的指令
- 每個JVM都包含:
方法區(qū)、Java堆、Java棧、本地方法棧、指令計數(shù)器及其他隱含寄存器

對于JVM的學習,在我看來這么幾個部分最重要:
Java代碼編譯和執(zhí)行的整個過程
JVM內(nèi)存管理及垃圾回收機制
下面分別對這幾部分進行說明:
2、Java代碼編譯和執(zhí)行的整個過程
也正如前面所說,Java代碼的編譯和執(zhí)行的整個過程大概是:開發(fā)人員編寫Java代碼(.java文件),然后將之編譯成字節(jié)碼(.class文件),再然后字節(jié)碼被裝入內(nèi)存,一旦字節(jié)碼進入虛擬機,它就會被解釋器解釋執(zhí)行,或者是被即時代碼發(fā)生器有選擇的轉(zhuǎn)換成機器碼執(zhí)行。
(1)Java代碼編譯是由Java源碼編譯器來完成,也就是Java代碼到JVM字節(jié)碼(.class文件)的過程。 流程圖如下所示:

(2)Java字節(jié)碼的執(zhí)行是由JVM執(zhí)行引擎來完成,流程圖如下所示:

Java代碼編譯和執(zhí)行的整個過程包含了以下三個重要的機制:
- Java源碼編譯機制
- 類加載機制
- 類執(zhí)行機制
(1)Java源碼編譯機制
Java 源碼編譯由以下三個過程組成:
①分析和輸入到符號表
②注解處理
③語義分析和生成class文件
流程圖如下所示:

最后生成的class文件由以下部分組成:
①結(jié)構(gòu)信息:包括class文件格式版本號及各部分的數(shù)量與大小的信息
②元數(shù)據(jù):對應于Java源碼中聲明與常量的信息。包含類/繼承的超類/實現(xiàn)的接口的聲明信息、域與方法聲明信息和常量池
③方法信息:對應Java源碼中語句和表達式對應的信息。包含字節(jié)碼、異常處理器表、求值棧與局部變量區(qū)大小、求值棧的類型記錄、調(diào)試符號信息
(2)類加載機制
JVM的類加載是通過ClassLoader及其子類來完成的,類的層次關系和加載順序可以由下圖來描述:

①Bootstrap ClassLoader
負責加載$JAVA_HOME中jre/lib/rt.jar里所有的class,由C++實現(xiàn),不是ClassLoader子類
②Extension ClassLoader
負責加載java平臺中擴展功能的一些jar包,包括$JAVA_HOME中jre/lib/*.jar或-Djava.ext.dirs指定目錄下的jar包
③App ClassLoader
負責記載classpath中指定的jar包及目錄中class
④Custom ClassLoader
屬于應用程序根據(jù)自身需要自定義的ClassLoader,如tomcat、jboss都會根據(jù)j2ee規(guī)范自行實現(xiàn)ClassLoader加載過程中會先檢查類是否被已加載,檢查順序是自底向上,從Custom ClassLoader到BootStrap ClassLoader逐層檢查,只要某個classloader已加載就視為已加載此類,保證此類只所有ClassLoader加載一次。而加載的順序是自頂向下,也就是由上層來逐層嘗試加載此類。
(3)類執(zhí)行機制
JVM是基于堆棧的虛擬機。JVM為每個新創(chuàng)建的線程都分配一個堆棧.也就是說,對于一個Java程序來說,它的運行就是通過對堆棧的操作來完成的。堆棧以幀為單位保存線程的狀態(tài)。JVM對堆棧只進行兩種操作:以幀為單位的壓棧和出棧操作。
JVM執(zhí)行class字節(jié)碼,線程創(chuàng)建后,都會產(chǎn)生程序計數(shù)器(PC)和棧(Stack),程序計數(shù)器存放下一條要執(zhí)行的指令在方法內(nèi)的偏移量,棧中存放一個個棧幀,每個棧幀對應著每個方法的每次調(diào)用,而棧幀又是有局部變量區(qū)和操作數(shù)棧兩部分組成,局部變量區(qū)用于存放方法中的局部變量和參數(shù),操作數(shù)棧中用于存放方法執(zhí)行過程中產(chǎn)生的中間結(jié)果。棧的結(jié)構(gòu)如下圖所示:

3、JVM內(nèi)存管理及垃圾回收機制
JVM內(nèi)存結(jié)構(gòu)分為:方法區(qū)(method),棧內(nèi)存(stack),堆內(nèi)存(heap),本地方法棧(java中的jni調(diào)用),結(jié)構(gòu)圖如下所示:

(1)堆內(nèi)存(heap)
所有通過new創(chuàng)建的對象的內(nèi)存都在堆中分配,其大小可以通過-Xmx和-Xms來控制。
操作系統(tǒng)有一個記錄空閑內(nèi)存地址的鏈表,當系統(tǒng)收到程序的申請時,會遍歷該鏈表,尋找第一個空間大于所申請空間的堆結(jié)點,然后將該結(jié)點從空閑結(jié)點鏈表中刪除,并將該結(jié)點的空間分配給程序,另外,對于大多數(shù)系統(tǒng),會在這塊內(nèi)存空間中的首地址處記錄本次分配的大小,這樣代碼中的delete語句才能正確的釋放本內(nèi)存空間。但由于找到的堆結(jié)點的大小不一定正好等于申請的大小,系統(tǒng)會自動的將多余的那部分重新放入空閑鏈表中。這時由new分配的內(nèi)存,一般速度比較慢,而且容易產(chǎn)生內(nèi)存碎片,不過用起來最方便。另外,在WINDOWS下,最好的方式是用VirtualAlloc分配內(nèi)存,它不是在堆,也不是在棧,而是直接在進程的地址空間中保留一塊內(nèi)存,雖然這種方法用起來最不方便,但是速度快,也是最靈活的。堆內(nèi)存是向高地址擴展的數(shù)據(jù)結(jié)構(gòu),是不連續(xù)的內(nèi)存區(qū)域。由于系統(tǒng)是用鏈表來存儲的空閑內(nèi)存地址的,自然是不連續(xù)的,而鏈表的遍歷方向是由低地址向高地址。堆的大小受限于計算機系統(tǒng)中有效的虛擬內(nèi)存。由此可見,堆獲得的空間比較靈活,也比較大。
(2)棧內(nèi)存(stack)
在Windows下, 棧是向低地址擴展的數(shù)據(jù)結(jié)構(gòu),是一塊連續(xù)的內(nèi)存區(qū)域。這句話的意思是棧頂?shù)牡刂泛蜅5淖畲笕萘渴窍到y(tǒng)預先規(guī)定好的,在WINDOWS下,棧的大小是固定的(是一個編譯時就確定的常數(shù)),如果申請的空間超過棧的剩余空間時,將提示overflow。因此,能從棧獲得的空間較小。只要棧的剩余空間大于所申請空間,系統(tǒng)將為程序提供內(nèi)存,否則將報異常提示棧溢出。 由系統(tǒng)自動分配,速度較快。但程序員是無法控制的。堆內(nèi)存與棧內(nèi)存需要說明:
基礎數(shù)據(jù)類型直接在棧空間分配,方法的形式參數(shù),直接在棧空間分配,當方法調(diào)用完成后從棧空間回收。引用數(shù)據(jù)類型,需要用new來創(chuàng)建,既在棧空間分配一個地址空間,又在堆空間分配對象的類變量 。方法的引用參數(shù),在棧空間分配一個地址空間,并指向堆空間的對象區(qū),當方法調(diào)用完成后從棧空間回收。局部變量new出來時,在棧空間和堆空間中分配空間,當局部變量生命周期結(jié)束后,棧空間立刻被回收,堆空間區(qū)域等待GC回收。方法調(diào)用時傳入的literal參數(shù),先在棧空間分配,在方法調(diào)用完成后從棧空間收回。字符串常量、static在DATA區(qū)域分配,this在堆空間分配。數(shù)組既在棧空間分配數(shù)組名稱,又在堆空間分配數(shù)組實際的大小。
如:

(3)本地方法棧(java中的jni調(diào)用)
用于支持native方法的執(zhí)行,存儲了每個native方法調(diào)用的狀態(tài)。對于本地方法接口,實現(xiàn)JVM并不要求一定要有它的支持,甚至可以完全沒有。Sun公司實現(xiàn)Java本地接口(JNI)是出于可移植性的考慮,當然我們也可以設計出其它的本地接口來代替Sun公司的JNI。但是這些設計與實現(xiàn)是比較復雜的事情,需要確保垃圾回收器不會將那些正在被本地方法調(diào)用的對象釋放掉。
(4)方法區(qū)(method)
它保存方法代碼(編譯后的java代碼)和符號表。存放了要加載的類信息、靜態(tài)變量、final類型的常量、屬性和方法信息。JVM用持久代(Permanet Generation)來存放方法區(qū),可通過-XX:PermSize和-XX:MaxPermSize來指定最小值和最大值。
垃圾回收機制
堆里聚集了所有由應用程序創(chuàng)建的對象,JVM也有對應的指令比如 new, newarray, anewarray和multianewarray,然并沒有向 C++ 的 delete,free 等釋放空間的指令,Java的所有釋放都由 GC 來做,GC除了做回收內(nèi)存之外,另外一個重要的工作就是內(nèi)存的壓縮,這個在其他的語言中也有類似的實現(xiàn),相比 C++ 不僅好用,而且增加了安全性,當然她也有弊端,比如性能這個大問題。4、Java虛擬機的運行過程示例
上面對虛擬機的各個部分進行了比較詳細的說明,下面通過一個具體的例子來分析它的運行過程。
虛擬機通過調(diào)用某個指定類的方法main啟動,傳遞給main一個字符串數(shù)組參數(shù),使指定的類被裝載,同時鏈接該類所使用的其它的類型,并且初始化它們。例如對于程序:

編譯后在命令行模式下鍵入: java HelloApp run virtual machine
將通過調(diào)用HelloApp的方法main來啟動java虛擬機,傳遞給main一個包含三個字符串”run”、”virtual”、”machine”的數(shù)組。現(xiàn)在我們略述虛擬機在執(zhí)行HelloApp時可能采取的步驟。
開始試圖執(zhí)行類HelloApp的main方法,發(fā)現(xiàn)該類并沒有被裝載,也就是說虛擬機當前不包含該類的二進制代表,于是虛擬機使用ClassLoader試圖尋找這樣的二進制代表。如果這個進程失敗,則拋出一個異常。類被裝載后同時在main方法被調(diào)用之前,必須對類HelloApp與其它類型進行鏈接然后初始化。鏈接包含三個階段:檢驗,準備和解析。檢驗檢查被裝載的主類的符號和語義,準備則創(chuàng)建類或接口的靜態(tài)域以及把這些域初始化為標準的默認值,解析負責檢查主類對其它類或接口的符號引用,在這一步它是可選的。類的初始化是對類中聲明的靜態(tài)初始化函數(shù)和靜態(tài)域的初始化構(gòu)造方法的執(zhí)行。一個類在初始化之前它的父類必須被初始化。整個過程如下:


















