volatile這個(gè)關(guān)鍵字可能很多朋友都聽說過,或許也都用過。在Java 5之前,它是一個(gè)備受爭(zhēng)議的關(guān)鍵字,因?yàn)樵诔绦蛑惺褂盟鶗?huì)導(dǎo)致出人意料的結(jié)果。在Java 5之后,volatile關(guān)鍵字才得以重獲生機(jī)。
volatile關(guān)鍵字雖然從字面上理解起來比較簡(jiǎn)單,但是要用好不是一件容易的事情。由于volatile關(guān)鍵字是與Java的內(nèi)存模型有關(guān)的,因此在講述volatile關(guān)鍵之前,我們先來了解一下與內(nèi)存模型相關(guān)的概念和知識(shí),然后分析了volatile關(guān)鍵字的實(shí)現(xiàn)原理,最后給出了幾個(gè)使用volatile關(guān)鍵字的場(chǎng)景。
以下是本文的目錄大綱:
一、Java內(nèi)存模型的概念
二、Java并發(fā)編程中的三個(gè)概念
三、Java內(nèi)存模型
四、深入剖析volatile關(guān)鍵字
五、使用volatile關(guān)鍵字的場(chǎng)景
大家都知道,計(jì)算機(jī)在執(zhí)行程序時(shí),每條指令都是在CPU中執(zhí)行的,而執(zhí)行指令過程中,勢(shì)必涉及到數(shù)據(jù)的讀取和寫入。由于程序運(yùn)行過程中的臨時(shí)數(shù)據(jù)是存放在主存(物理內(nèi)存)當(dāng)中的,這時(shí)就存在一個(gè)問題,由于CPU執(zhí)行速度很快,而從內(nèi)存讀取數(shù)據(jù)和向內(nèi)存寫入數(shù)據(jù)的過程跟CPU執(zhí)行指令的速度比起來要慢的多,因此如果任何時(shí)候?qū)?shù)據(jù)的操作都要通過和內(nèi)存的交互來進(jìn)行,會(huì)大大降低指令執(zhí)行的速度。因此在CPU里面就有了高速緩存。
也就是,當(dāng)程序在運(yùn)行過程中,會(huì)將運(yùn)算需要的數(shù)據(jù)從主存復(fù)制一份到CPU的高速緩存當(dāng)中,那么CPU進(jìn)行計(jì)算時(shí)就可以直接從它的高速緩存讀取數(shù)據(jù)和向其中寫入數(shù)據(jù),當(dāng)運(yùn)算結(jié)束之后,再將高速緩存中的數(shù)據(jù)刷新到主存當(dāng)中。舉個(gè)簡(jiǎn)單的例子,比如下面的這段代碼:
i = i + 1;
當(dāng)線程執(zhí)行這個(gè)語句時(shí),會(huì)先從主存當(dāng)中讀取i的值,然后復(fù)制一份到高速緩存當(dāng)中,然后CPU執(zhí)行指令對(duì)i進(jìn)行加1操作,然后將數(shù)據(jù)寫入高速緩存,最后將高速緩存中i最新的值刷新到主存當(dāng)中。
這個(gè)代碼在單線程中運(yùn)行是沒有任何問題的,但是在多線程中運(yùn)行就會(huì)有問題了。在多核CPU中,每條線程可能運(yùn)行于不同的CPU中,因此每個(gè)線程運(yùn)行時(shí)有自己的高速緩存(對(duì)單核CPU來說,其實(shí)也會(huì)出現(xiàn)這種問題,只不過是以線程調(diào)度的形式來分別執(zhí)行的)。本文我們以多核CPU為例。
比如同時(shí)有2個(gè)線程執(zhí)行這段代碼,假如初始時(shí)i的值為0,那么我們希望兩個(gè)線程執(zhí)行完之后i的值變?yōu)?。但是事實(shí)會(huì)是這樣嗎?
可能存在下面一種情況:初始時(shí),兩個(gè)線程分別讀取i的值存入各自所在的CPU的高速緩存當(dāng)中,然后線程1進(jìn)行加1操作,然后把i的最新值1寫入到內(nèi)存。此時(shí)線程2的高速緩存當(dāng)中i的值還是0,進(jìn)行加1操作之后,i的值為1,然后線程2把i的值寫入內(nèi)存。
最終結(jié)果i的值是1,而不是2。這就是著名的緩存一致性問題。通常稱這種被多個(gè)線程訪問的變量為共享變量。
也就是說,如果一個(gè)變量在多個(gè)CPU中都存在緩存(一般在多線程編程時(shí)才會(huì)出現(xiàn)),那么就可能存在緩存不一致的問題。
為了解決緩存不一致性問題,通常來說有以下2種解決方法:
1、通過在總線加LOCK#鎖的方式
2、通過緩存一致性協(xié)議
這2種方式都是硬件層面上提供的方式。
在早期的CPU當(dāng)中,是通過在總線上加LOCK#鎖的形式來解決緩存不一致的問題。因?yàn)镃PU和其他部件進(jìn)行通信都是通過總線來進(jìn)行的,如果對(duì)總線加LOCK#鎖的話,也就是說阻塞了其他CPU對(duì)其他部件訪問(如內(nèi)存),從而使得只能有一個(gè)CPU能使用這個(gè)變量的內(nèi)存。比如上面例子中 如果一個(gè)線程在執(zhí)行 i = i +1,如果在執(zhí)行這段代碼的過程中,在總線上發(fā)出了LCOK#鎖的信號(hào),那么只有等待這段代碼完全執(zhí)行完畢之后,其他CPU才能從變量i所在的內(nèi)存讀取變量,然后進(jìn)行相應(yīng)的操作。這樣就解決了緩存不一致的問題。
但是上面的方式會(huì)有一個(gè)問題,由于在鎖住總線期間,其他CPU無法訪問內(nèi)存,導(dǎo)致效率低下。所以就出現(xiàn)了緩存一致性協(xié)議。最出名的就是Intel 的MESI協(xié)議,MESI協(xié)議保證了每個(gè)緩存中使用的共享變量的副本是一致的。它核心的思想是:當(dāng)CPU寫數(shù)據(jù)時(shí),如果發(fā)現(xiàn)操作的變量是共享變量,即在其他CPU中也存在該變量的副本,會(huì)發(fā)出信號(hào)通知其他CPU將該變量的緩存行置為無效狀態(tài),因此當(dāng)其他CPU需要讀取這個(gè)變量時(shí),發(fā)現(xiàn)自己緩存中緩存該變量的緩存行是無效的,那么它就會(huì)從內(nèi)存重新讀取。