|
前言
我們寫好的一行行代碼,為了讓其工作起來,我們還得把它送進(jìn)城(進(jìn)程)里,那既然進(jìn)了城里,那肯定不能胡作非為了。 城里人有城里人的規(guī)矩,城中有個(gè)專門管轄你們的城管(操作系統(tǒng)),人家讓你休息就休息,讓你工作就工作,畢竟攤位(CPU)就一個(gè),每個(gè)人都要占這個(gè)攤位來工作,城里要工作的人多著去了。 所以城管為了公平起見,它使用一種策略(調(diào)度)方式,給每個(gè)人一個(gè)固定的工作時(shí)間(時(shí)間片),時(shí)間到了就會(huì)通知你去休息而換另外一個(gè)人上場(chǎng)工作。 另外,在休息時(shí)候你也不能偷懶,要記住工作到哪了,不然下次到你工作了,你忘記工作到哪了,那還怎么繼續(xù)? 有的人,可能還進(jìn)入了縣城(線程)工作,這里相對(duì)輕松一些,在休息的時(shí)候,要記住的東西相對(duì)較少,而且還能共享城里的資源。
可以,聰明的你猜出來了,也不枉費(fèi)我瞎編亂造的故事了。 進(jìn)程和線程對(duì)于寫代碼的我們,真的天天見、日日見了,但見的多不代表你就熟悉它們,比如簡(jiǎn)單問你一句,你知道它們的工作原理和區(qū)別嗎? 不知道沒關(guān)系,今天就要跟大家討論操作系統(tǒng)的進(jìn)程和線程。 進(jìn)程我們編寫的代碼只是一個(gè)存儲(chǔ)在硬盤的靜態(tài)文件,通過編譯后就會(huì)生成二進(jìn)制可執(zhí)行文件,當(dāng)我們運(yùn)行這個(gè)可執(zhí)行文件后,它會(huì)被裝載到內(nèi)存中,接著 CPU 會(huì)執(zhí)行程序中的每一條指令,那么這個(gè)運(yùn)行中的程序,就被稱為「進(jìn)程」。 現(xiàn)在我們考慮有一個(gè)會(huì)讀取硬盤文件數(shù)據(jù)的程序被執(zhí)行了,那么當(dāng)運(yùn)行到讀取文件的指令時(shí),就會(huì)去從硬盤讀取數(shù)據(jù),但是硬盤的讀寫速度是非常慢的,那么在這個(gè)時(shí)候,如果 CPU 傻傻的等硬盤返回?cái)?shù)據(jù)的話,那 CPU 的利用率是非常低的。 做個(gè)類比,你去煮開水時(shí),你會(huì)傻傻的等水壺?zé)_嗎?很明顯,小孩也不會(huì)傻等。我們可以在水壺?zé)_之前去做其他事情。當(dāng)水壺?zé)_了,我們自然就會(huì)聽到“嘀嘀嘀”的聲音,于是再把燒開的水倒入到水杯里就好了。 所以,當(dāng)進(jìn)程要從硬盤讀取數(shù)據(jù)時(shí),CPU 不需要阻塞等待數(shù)據(jù)的返回,而是去執(zhí)行另外的進(jìn)程。當(dāng)硬盤數(shù)據(jù)返回時(shí),CPU 會(huì)收到個(gè)中斷,于是 CPU 再繼續(xù)運(yùn)行這個(gè)進(jìn)程。 這種多個(gè)程序、交替執(zhí)行的思想,就有 CPU 管理多個(gè)進(jìn)程的初步想法。 對(duì)于一個(gè)支持多進(jìn)程的系統(tǒng),CPU 會(huì)從一個(gè)進(jìn)程快速切換至另一個(gè)進(jìn)程,其間每個(gè)進(jìn)程各運(yùn)行幾十或幾百個(gè)毫秒。 雖然單核的 CPU 在某一個(gè)瞬間,只能運(yùn)行一個(gè)進(jìn)程。但在 1 秒鐘期間,它可能會(huì)運(yùn)行多個(gè)進(jìn)程,這樣就產(chǎn)生并行的錯(cuò)覺,實(shí)際上這是并發(fā)。
一圖勝千言。
到了晚飯時(shí)間,一對(duì)小情侶肚子都咕咕叫了,于是男生見機(jī)行事,就想給女生做晚飯,所以他就在網(wǎng)上找了辣子雞的菜譜,接著買了一些雞肉、辣椒、香料等材料,然后邊看邊學(xué)邊做這道菜。 突然,女生說她想喝可樂,那么男生只好把做菜的事情暫停一下,并在手機(jī)菜譜標(biāo)記做到哪一個(gè)步驟,把狀態(tài)信息記錄了下來。 然后男生聽從女生的指令,跑去下樓買了一瓶冰可樂后,又回到廚房繼續(xù)做菜。 這體現(xiàn)了,CPU 可以從一個(gè)進(jìn)程(做菜)切換到另外一個(gè)進(jìn)程(買可樂),在切換前必須要記錄當(dāng)前進(jìn)程中運(yùn)行的狀態(tài)信息,以備下次切換回來的時(shí)候可以恢復(fù)執(zhí)行。 所以,可以發(fā)現(xiàn)進(jìn)程有著「運(yùn)行 - 暫停 - 運(yùn)行」的活動(dòng)規(guī)律。 進(jìn)程的狀態(tài)在上面,我們知道了進(jìn)程有著「運(yùn)行 - 暫停 - 運(yùn)行」的活動(dòng)規(guī)律。一般說來,一個(gè)進(jìn)程并不是自始至終連續(xù)不停地運(yùn)行的,它與并發(fā)執(zhí)行中的其他進(jìn)程的執(zhí)行是相互制約的。 它有時(shí)處于運(yùn)行狀態(tài),有時(shí)又由于某種原因而暫停運(yùn)行處于等待狀態(tài),當(dāng)使它暫停的原因消失后,它又進(jìn)入準(zhǔn)備運(yùn)行狀態(tài)。 所以,在一個(gè)進(jìn)程的活動(dòng)期間至少具備三種基本狀態(tài),即運(yùn)行狀態(tài)、就緒狀態(tài)、阻塞狀態(tài)。 上圖中各個(gè)狀態(tài)的意義:
當(dāng)然,進(jìn)程另外兩個(gè)基本狀態(tài):
于是,一個(gè)完整的進(jìn)程狀態(tài)的變遷如下圖: 再來詳細(xì)說明一下進(jìn)程的狀態(tài)變遷:
另外,還有一個(gè)狀態(tài)叫掛起狀態(tài),它表示進(jìn)程沒有占有物理內(nèi)存空間。這跟阻塞狀態(tài)是不一樣,阻塞狀態(tài)是等待某個(gè)事件的返回。 由于虛擬內(nèi)存管理原因,進(jìn)程的所使用的空間可能并沒有映射到物理內(nèi)存,而是在硬盤上,這時(shí)進(jìn)程就會(huì)出現(xiàn)掛起狀態(tài),另外調(diào)用 sleep 也會(huì)被掛起。 掛起狀態(tài)可以分為兩種:
這兩種掛起狀態(tài)加上前面的五種狀態(tài),就變成了七種狀態(tài)變遷(留給我的顏色不多了),見如下圖: ![]() 進(jìn)程的控制結(jié)構(gòu)在操作系統(tǒng)中,是用進(jìn)程控制塊(process control block,PCB)數(shù)據(jù)結(jié)構(gòu)來描述進(jìn)程的。 那 PCB 是什么呢?打開知乎搜索你就會(huì)發(fā)現(xiàn)這個(gè)東西并不是那么簡(jiǎn)單。 ![]() 打住打住,我們是個(gè)正經(jīng)的人,怎么會(huì)去看那些問題呢?是吧,回來回來。 PCB 是進(jìn)程存在的唯一標(biāo)識(shí),這意味著一個(gè)進(jìn)程的存在,必然會(huì)有一個(gè) PCB,如果進(jìn)程消失了,那么 PCB 也會(huì)隨之消失。
進(jìn)程描述信息:
進(jìn)程控制和管理信息:
資源分配清單:
CPU 相關(guān)信息:
可見,PCB 包含信息還是比較多的。
通常是通過鏈表的方式進(jìn)行組織,把具有相同狀態(tài)的進(jìn)程鏈在一起,組成各種隊(duì)列。比如:
那么,就緒隊(duì)列和阻塞隊(duì)列鏈表的組織形式如下圖: ![]() 除了鏈接的組織方式,還有索引方式,它的工作原理:將同一狀態(tài)的進(jìn)程組織在一個(gè)索引表中,索引表項(xiàng)指向相應(yīng)的 PCB,不同狀態(tài)對(duì)應(yīng)不同的索引表。 一般會(huì)選擇鏈表,因?yàn)榭赡苊媾R進(jìn)程創(chuàng)建,銷毀等調(diào)度導(dǎo)致進(jìn)程狀態(tài)發(fā)生變化,所以鏈表能夠更加靈活的插入和刪除。 進(jìn)程的控制我們熟知了進(jìn)程的狀態(tài)變遷和進(jìn)程的數(shù)據(jù)結(jié)構(gòu) PCB 后,再來看看進(jìn)程的創(chuàng)建、終止、阻塞、喚醒的過程,這些過程也就是進(jìn)程的控制。 01 創(chuàng)建進(jìn)程 操作系統(tǒng)允許一個(gè)進(jìn)程創(chuàng)建另一個(gè)進(jìn)程,而且允許子進(jìn)程繼承父進(jìn)程所擁有的資源,當(dāng)子進(jìn)程被終止時(shí),其在父進(jìn)程處繼承的資源應(yīng)當(dāng)還給父進(jìn)程。同時(shí),終止父進(jìn)程時(shí)同時(shí)也會(huì)終止其所有的子進(jìn)程。 創(chuàng)建進(jìn)程的過程如下:
02 終止進(jìn)程 進(jìn)程可以有 3 種終止方式:正常結(jié)束、異常結(jié)束以及外界干預(yù)(信號(hào)kill 掉)。 終止進(jìn)程的過程如下:
03 阻塞進(jìn)程 當(dāng)進(jìn)程需要等待某一事件完成時(shí),它可以調(diào)用阻塞語句把自己阻塞等待。而一旦被阻塞等待,它只能由另一個(gè)進(jìn)程喚醒。 阻塞進(jìn)程的過程如下:
04 喚醒進(jìn)程 進(jìn)程由「運(yùn)行」轉(zhuǎn)變?yōu)椤缸枞範(fàn)顟B(tài)是由于進(jìn)程必須等待某一事件的完成,所以處于阻塞狀態(tài)的進(jìn)程是絕對(duì)不可能叫醒自己的。 如果某進(jìn)程正在等待 I/O 事件,需由別的進(jìn)程發(fā)消息給它,則只有當(dāng)該進(jìn)程所期待的事件出現(xiàn)時(shí),才由發(fā)現(xiàn)者進(jìn)程用喚醒語句叫醒它。 喚醒進(jìn)程的過程如下:
進(jìn)程的阻塞和喚醒是一對(duì)功能相反的語句,如果某個(gè)進(jìn)程調(diào)用了阻塞語句,則必有一個(gè)與之對(duì)應(yīng)的喚醒語句。 進(jìn)程的上下文切換各個(gè)進(jìn)程之間是共享 CPU 資源的,在不同的時(shí)候進(jìn)程之間需要切換,讓不同的進(jìn)程可以在 CPU 執(zhí)行,那么這個(gè)一個(gè)進(jìn)程切換到另一個(gè)進(jìn)程運(yùn)行,稱為進(jìn)程的上下文切換。
大多數(shù)操作系統(tǒng)都是多任務(wù),通常支持大于 CPU 數(shù)量的任務(wù)同時(shí)運(yùn)行。實(shí)際上,這些任務(wù)并不是同時(shí)運(yùn)行的,只是因?yàn)橄到y(tǒng)在很短的時(shí)間內(nèi),讓各個(gè)任務(wù)分別在 CPU 運(yùn)行,于是就造成同時(shí)運(yùn)行的錯(cuò)覺。 任務(wù)是交給 CPU 運(yùn)行的,那么在每個(gè)任務(wù)運(yùn)行前,CPU 需要知道任務(wù)從哪里加載,又從哪里開始運(yùn)行。 所以,操作系統(tǒng)需要事先幫 CPU 設(shè)置好 CPU 寄存器和程序計(jì)數(shù)器。 CPU 寄存器是 CPU 內(nèi)部一個(gè)容量小,但是速度極快的內(nèi)存(緩存)。我舉個(gè)例子,寄存器像是你的口袋,內(nèi)存像你的書包,硬盤則是你家里的柜子,如果你的東西存放到口袋,那肯定是比你從書包或家里柜子取出來要快的多。 再來,程序計(jì)數(shù)器則是用來存儲(chǔ) CPU 正在執(zhí)行的指令位置、或者即將執(zhí)行的下一條指令位置。 所以說,CPU 寄存器和程序計(jì)數(shù)是 CPU 在運(yùn)行任何任務(wù)前,所必須依賴的環(huán)境,這些環(huán)境就叫做 CPU 上下文。 既然知道了什么是 CPU 上下文,那理解 CPU 上下文切換就不難了。 CPU 上下文切換就是先把前一個(gè)任務(wù)的 CPU 上下文(CPU 寄存器和程序計(jì)數(shù)器)保存起來,然后加載新任務(wù)的上下文到這些寄存器和程序計(jì)數(shù)器,最后再跳轉(zhuǎn)到程序計(jì)數(shù)器所指的新位置,運(yùn)行新任務(wù)。 系統(tǒng)內(nèi)核會(huì)存儲(chǔ)保持下來的上下文信息,當(dāng)此任務(wù)再次被分配給 CPU 運(yùn)行時(shí),CPU 會(huì)重新加載這些上下文,這樣就能保證任務(wù)原來的狀態(tài)不受影響,讓任務(wù)看起來還是連續(xù)運(yùn)行。 上面說到所謂的「任務(wù)」,主要包含進(jìn)程、線程和中斷。所以,可以根據(jù)任務(wù)的不同,把 CPU 上下文切換分成:進(jìn)程上下文切換、線程上下文切換和中斷上下文切換。
進(jìn)程是由內(nèi)核管理和調(diào)度的,所以進(jìn)程的切換只能發(fā)生在內(nèi)核態(tài)。 所以,進(jìn)程的上下文切換不僅包含了虛擬內(nèi)存、棧、全局變量等用戶空間的資源,還包括了內(nèi)核堆棧、寄存器等內(nèi)核空間的資源。 通常,會(huì)把交換的信息保存在進(jìn)程的 PCB,當(dāng)要運(yùn)行另外一個(gè)進(jìn)程的時(shí)候,我們需要從這個(gè)進(jìn)程的 PCB 取出上下文,然后恢復(fù)到 CPU 中,這使得這個(gè)進(jìn)程可以繼續(xù)執(zhí)行,如下圖所示: ![]() 大家需要注意,進(jìn)程的上下文開銷是很關(guān)鍵的,我們希望它的開銷越小越好,這樣可以使得進(jìn)程可以把更多時(shí)間花費(fèi)在執(zhí)行程序上,而不是耗費(fèi)在上下文切換。
以上,就是發(fā)生進(jìn)程上下文切換的常見場(chǎng)景了。
線程在早期的操作系統(tǒng)中都是以進(jìn)程作為獨(dú)立運(yùn)行的基本單位,直到后面,計(jì)算機(jī)科學(xué)家們又提出了更小的能獨(dú)立運(yùn)行的基本單位,也就是線程。 為什么使用線程?我們舉個(gè)例子,假設(shè)你要編寫一個(gè)視頻播放器軟件,那么該軟件功能的核心模塊有三個(gè):
對(duì)于單進(jìn)程的實(shí)現(xiàn)方式,我想大家都會(huì)是以下這個(gè)方式: ![]() 對(duì)于單進(jìn)程的這種方式,存在以下問題:
那改進(jìn)成多進(jìn)程的方式: ![]() 對(duì)于多進(jìn)程的這種方式,依然會(huì)存在問題:
那到底如何解決呢?需要有一種新的實(shí)體,滿足以下特性:
這個(gè)新的實(shí)體,就是線程( Thread ),線程之間可以并發(fā)運(yùn)行且共享相同的地址空間。 什么是線程?線程是進(jìn)程當(dāng)中的一條執(zhí)行流程。 同一個(gè)進(jìn)程內(nèi)多個(gè)線程之間可以共享代碼段、數(shù)據(jù)段、打開的文件等資源,但每個(gè)線程都有獨(dú)立一套的寄存器和棧,這樣可以確保線程的控制流是相對(duì)獨(dú)立的。 ![]()
線程的優(yōu)點(diǎn):
線程的缺點(diǎn):
舉個(gè)例子,對(duì)于游戲的用戶設(shè)計(jì),則不應(yīng)該使用多線程的方式,否則一個(gè)用戶掛了,會(huì)影響其他同個(gè)進(jìn)程的線程。 線程與進(jìn)程的比較線程與進(jìn)程的比較如下:
對(duì)于,線程相比進(jìn)程能減少開銷,體現(xiàn)在:
所以,線程比進(jìn)程不管是時(shí)間效率,還是空間效率都要高。 線程的上下文切換在前面我們知道了,線程與進(jìn)程最大的區(qū)別在于:線程是調(diào)度的基本單位,而進(jìn)程則是資源擁有的基本單位。 所以,所謂操作系統(tǒng)的任務(wù)調(diào)度,實(shí)際上的調(diào)度對(duì)象是線程,而進(jìn)程只是給線程提供了虛擬內(nèi)存、全局變量等資源。 對(duì)于線程和進(jìn)程,我們可以這么理解:
另外,線程也有自己的私有數(shù)據(jù),比如棧和寄存器等,這些在上下文切換時(shí)也是需要保存的。
這還得看線程是不是屬于同一個(gè)進(jìn)程:
所以,線程的上下文切換相比進(jìn)程,開銷要小很多。 線程的實(shí)現(xiàn)主要有三種線程的實(shí)現(xiàn)方式:
那么,這還需要考慮一個(gè)問題,用戶線程和內(nèi)核線程的對(duì)應(yīng)關(guān)系。 首先,第一種關(guān)系是多對(duì)一的關(guān)系,也就是多個(gè)用戶線程對(duì)應(yīng)同一個(gè)內(nèi)核線程: ![]() 第二種是一對(duì)一的關(guān)系,也就是一個(gè)用戶線程對(duì)應(yīng)一個(gè)內(nèi)核線程: ![]() 第三種是多對(duì)多的關(guān)系,也就是多個(gè)用戶線程對(duì)應(yīng)到多個(gè)內(nèi)核線程: ![]()
用戶線程是基于用戶態(tài)的線程管理庫(kù)來實(shí)現(xiàn)的,那么線程控制塊(Thread Control Block, TCB) 也是在庫(kù)里面來實(shí)現(xiàn)的,對(duì)于操作系統(tǒng)而言是看不到這個(gè) TCB 的,它只能看到整個(gè)進(jìn)程的 PCB。 所以,用戶線程的整個(gè)線程管理和調(diào)度,操作系統(tǒng)是不直接參與的,而是由用戶級(jí)線程庫(kù)函數(shù)來完成線程的管理,包括線程的創(chuàng)建、終止、同步和調(diào)度等。 用戶級(jí)線程的模型,也就類似前面提到的多對(duì)一的關(guān)系,即多個(gè)用戶線程對(duì)應(yīng)同一個(gè)內(nèi)核線程,如下圖所示: ![]() 用戶線程的優(yōu)點(diǎn):
用戶線程的缺點(diǎn):
以上,就是用戶線程的優(yōu)缺點(diǎn)了。
內(nèi)核線程是由操作系統(tǒng)管理的,線程對(duì)應(yīng)的 TCB 自然是放在操作系統(tǒng)里的,這樣線程的創(chuàng)建、終止和管理都是由操作系統(tǒng)負(fù)責(zé)。 內(nèi)核線程的模型,也就類似前面提到的一對(duì)一的關(guān)系,即一個(gè)用戶線程對(duì)應(yīng)一個(gè)內(nèi)核線程,如下圖所示: ![]() 內(nèi)核線程的優(yōu)點(diǎn):
內(nèi)核線程的缺點(diǎn):
以上,就是內(nèi)核線的優(yōu)缺點(diǎn)了。
輕量級(jí)進(jìn)程(Light-weight process,LWP)是內(nèi)核支持的用戶線程,一個(gè)進(jìn)程可有一個(gè)或多個(gè) LWP,每個(gè) LWP 是跟內(nèi)核線程一對(duì)一映射的,也就是 LWP 都是由一個(gè)內(nèi)核線程支持。 另外,LWP 只能由內(nèi)核管理并像普通進(jìn)程一樣被調(diào)度,Linux 內(nèi)核是支持 LWP 的典型例子。 在大多數(shù)系統(tǒng)中,LWP與普通進(jìn)程的區(qū)別也在于它只有一個(gè)最小的執(zhí)行上下文和調(diào)度程序所需的統(tǒng)計(jì)信息。一般來說,一個(gè)進(jìn)程代表程序的一個(gè)實(shí)例,而 LWP 代表程序的執(zhí)行線程,因?yàn)橐粋€(gè)執(zhí)行線程不像進(jìn)程那樣需要那么多狀態(tài)信息,所以 LWP 也不帶有這樣的信息。 在 LWP 之上也是可以使用用戶線程的,那么 LWP 與用戶線程的對(duì)應(yīng)關(guān)系就有三種:
接下來針對(duì)上面這三種對(duì)應(yīng)關(guān)系說明它們優(yōu)缺點(diǎn)。先下圖的 LWP 模型: ![]() 1 : 1 模式 一個(gè)線程對(duì)應(yīng)到一個(gè) LWP 再對(duì)應(yīng)到一個(gè)內(nèi)核線程,如上圖的進(jìn)程 4,屬于此模型。
N : 1 模式 多個(gè)用戶線程對(duì)應(yīng)一個(gè) LWP 再對(duì)應(yīng)一個(gè)內(nèi)核線程,如上圖的進(jìn)程 2,線程管理是在用戶空間完成的,此模式中用戶的線程對(duì)操作系統(tǒng)不可見。
M : N 模式 根據(jù)前面的兩個(gè)模型混搭一起,就形成 M:N 模型,該模型提供了兩級(jí)控制,首先多個(gè)用戶線程對(duì)應(yīng)到多個(gè) LWP,LWP 再一一對(duì)應(yīng)到內(nèi)核線程,如上圖的進(jìn)程 3。
組合模式 如上圖的進(jìn)程 5,此進(jìn)程結(jié)合 1:1 模型和 M:N 模型。開發(fā)人員可以針對(duì)不同的應(yīng)用特點(diǎn)調(diào)節(jié)內(nèi)核線程的數(shù)目來達(dá)到物理并行性和邏輯并行性的最佳方案。
調(diào)度進(jìn)程都希望自己能夠占用 CPU 進(jìn)行工作,那么這涉及到前面說過的進(jìn)程上下文切換。 一旦操作系統(tǒng)把進(jìn)程切換到運(yùn)行狀態(tài),也就意味著該進(jìn)程占用著 CPU 在執(zhí)行,但是當(dāng)操作系統(tǒng)把進(jìn)程切換到其他狀態(tài)時(shí),那就不能在 CPU 中執(zhí)行了,于是操作系統(tǒng)會(huì)選擇下一個(gè)要運(yùn)行的進(jìn)程。 選擇一個(gè)進(jìn)程運(yùn)行這一功能是在操作系統(tǒng)中完成的,通常稱為調(diào)度程序(scheduler)。 那到底什么時(shí)候調(diào)度進(jìn)程,或以什么原則來調(diào)度進(jìn)程呢? 調(diào)度時(shí)機(jī)在進(jìn)程的生命周期中,當(dāng)進(jìn)程從一個(gè)運(yùn)行狀態(tài)到另外一狀態(tài)變化的時(shí)候,其實(shí)會(huì)觸發(fā)一次調(diào)度。 比如,以下狀態(tài)的變化都會(huì)觸發(fā)操作系統(tǒng)的調(diào)度:
因?yàn)椋@些狀態(tài)變化的時(shí)候,操作系統(tǒng)需要考慮是否要讓新的進(jìn)程給 CPU 運(yùn)行,或者是否讓當(dāng)前進(jìn)程從 CPU 上退出來而換另一個(gè)進(jìn)程運(yùn)行。 另外,如果硬件時(shí)鐘提供某個(gè)頻率的周期性中斷,那么可以根據(jù)如何處理時(shí)鐘中斷
調(diào)度原則原則一:如果運(yùn)行的程序,發(fā)生了 I/O 事件的請(qǐng)求,那 CPU 使用率必然會(huì)很低,因?yàn)榇藭r(shí)進(jìn)程在阻塞等待硬盤的數(shù)據(jù)返回。這樣的過程,勢(shì)必會(huì)造成 CPU 突然的空閑。所以,為了提高 CPU 利用率,在這種發(fā)送 I/O 事件致使 CPU 空閑的情況下,調(diào)度程序需要從就緒隊(duì)列中選擇一個(gè)進(jìn)程來運(yùn)行。 原則二:有的程序執(zhí)行某個(gè)任務(wù)花費(fèi)的時(shí)間會(huì)比較長(zhǎng),如果這個(gè)程序一直占用著 CPU,會(huì)造成系統(tǒng)吞吐量(CPU 在單位時(shí)間內(nèi)完成的進(jìn)程數(shù)量)的降低。所以,要提高系統(tǒng)的吞吐率,調(diào)度程序要權(quán)衡長(zhǎng)任務(wù)和短任務(wù)進(jìn)程的運(yùn)行完成數(shù)量。 原則三:從進(jìn)程開始到結(jié)束的過程中,實(shí)際上是包含兩個(gè)時(shí)間,分別是進(jìn)程運(yùn)行時(shí)間和進(jìn)程等待時(shí)間,這兩個(gè)時(shí)間總和就稱為周轉(zhuǎn)時(shí)間。進(jìn)程的周轉(zhuǎn)時(shí)間越小越好,如果進(jìn)程的等待時(shí)間很長(zhǎng)而運(yùn)行時(shí)間很短,那周轉(zhuǎn)時(shí)間就很長(zhǎng),這不是我們所期望的,調(diào)度程序應(yīng)該避免這種情況發(fā)生。 原則四:處于就緒隊(duì)列的進(jìn)程,也不能等太久,當(dāng)然希望這個(gè)等待的時(shí)間越短越好,這樣可以使得進(jìn)程更快的在 CPU 中執(zhí)行。所以,就緒隊(duì)列中進(jìn)程的等待時(shí)間也是調(diào)度程序所需要考慮的原則。 原則五:對(duì)于鼠標(biāo)、鍵盤這種交互式比較強(qiáng)的應(yīng)用,我們當(dāng)然希望它的響應(yīng)時(shí)間越快越好,否則就會(huì)影響用戶體驗(yàn)了。所以,對(duì)于交互式比較強(qiáng)的應(yīng)用,響應(yīng)時(shí)間也是調(diào)度程序需要考慮的原則。 ![]() 針對(duì)上面的五種調(diào)度原則,總結(jié)成如下:
說白了,這么多調(diào)度原則,目的就是要使得進(jìn)程要「快」。 調(diào)度算法不同的調(diào)度算法適用的場(chǎng)景也是不同的。 接下來,說說在單核 CPU 系統(tǒng)中常見的調(diào)度算法。
最簡(jiǎn)單的一個(gè)調(diào)度算法,就是非搶占式的先來先服務(wù)(First Come First Severd, FCFS)算法了。 ![]() 顧名思義,先來后到,每次從就緒隊(duì)列選擇最先進(jìn)入隊(duì)列的進(jìn)程,然后一直運(yùn)行,直到進(jìn)程退出或被阻塞,才會(huì)繼續(xù)從隊(duì)列中選擇第一個(gè)進(jìn)程接著運(yùn)行。 這似乎很公平,但是當(dāng)一個(gè)長(zhǎng)作業(yè)先運(yùn)行了,那么后面的短作業(yè)等待的時(shí)間就會(huì)很長(zhǎng),不利于短作業(yè)。 FCFS 對(duì)長(zhǎng)作業(yè)有利,適用于 CPU 繁忙型作業(yè)的系統(tǒng),而不適用于 I/O 繁忙型作業(yè)的系統(tǒng)。
最短作業(yè)優(yōu)先(Shortest Job First, SJF)調(diào)度算法同樣也是顧名思義,它會(huì)優(yōu)先選擇運(yùn)行時(shí)間最短的進(jìn)程來運(yùn)行,這有助于提高系統(tǒng)的吞吐量。 ![]() 這顯然對(duì)長(zhǎng)作業(yè)不利,很容易造成一種極端現(xiàn)象。 比如,一個(gè)長(zhǎng)作業(yè)在就緒隊(duì)列等待運(yùn)行,而這個(gè)就緒隊(duì)列有非常多的短作業(yè),那么就會(huì)使得長(zhǎng)作業(yè)不斷的往后推,周轉(zhuǎn)時(shí)間變長(zhǎng),致使長(zhǎng)作業(yè)長(zhǎng)期不會(huì)被運(yùn)行。
前面的「先來先服務(wù)調(diào)度算法」和「最短作業(yè)優(yōu)先調(diào)度算法」都沒有很好的權(quán)衡短作業(yè)和長(zhǎng)作業(yè)。 那么,高響應(yīng)比優(yōu)先 (Highest Response Ratio Next, HRRN)調(diào)度算法主要是權(quán)衡了短作業(yè)和長(zhǎng)作業(yè)。 每次進(jìn)行進(jìn)程調(diào)度時(shí),先計(jì)算「響應(yīng)比優(yōu)先級(jí)」,然后把「響應(yīng)比優(yōu)先級(jí)」最高的進(jìn)程投入運(yùn)行,「響應(yīng)比優(yōu)先級(jí)」的計(jì)算公式: ![]() 從上面的公式,可以發(fā)現(xiàn):
最古老、最簡(jiǎn)單、最公平且使用最廣的算法就是時(shí)間片輪轉(zhuǎn)(Round Robin, RR)調(diào)度算法。 ![]() 每個(gè)進(jìn)程被分配一個(gè)時(shí)間段,稱為時(shí)間片(Quantum),即允許該進(jìn)程在該時(shí)間段中運(yùn)行。
另外,時(shí)間片的長(zhǎng)度就是一個(gè)很關(guān)鍵的點(diǎn):
通常時(shí)間片設(shè)為 20ms~50ms 通常是一個(gè)比較合理的折中值。
前面的「時(shí)間片輪轉(zhuǎn)算法」做了個(gè)假設(shè),即讓所有的進(jìn)程同等重要,也不偏袒誰,大家的運(yùn)行時(shí)間都一樣。 但是,對(duì)于多用戶計(jì)算機(jī)系統(tǒng)就有不同的看法了,它們希望調(diào)度是有優(yōu)先級(jí)的,即希望調(diào)度程序能從就緒隊(duì)列中選擇最高優(yōu)先級(jí)的進(jìn)程進(jìn)行運(yùn)行,這稱為最高優(yōu)先級(jí)(Highest Priority First,HPF)調(diào)度算法。 進(jìn)程的優(yōu)先級(jí)可以分為,靜態(tài)優(yōu)先級(jí)或動(dòng)態(tài)優(yōu)先級(jí):
該算法也有兩種處理優(yōu)先級(jí)高的方法,非搶占式和搶占式:
但是依然有缺點(diǎn),可能會(huì)導(dǎo)致低優(yōu)先級(jí)的進(jìn)程永遠(yuǎn)不會(huì)運(yùn)行。
多級(jí)反饋隊(duì)列(Multilevel Feedback Queue)調(diào)度算法是「時(shí)間片輪轉(zhuǎn)算法」和「最高優(yōu)先級(jí)算法」的綜合和發(fā)展。 顧名思義:
![]() 來看看,它是如何工作的:
可以發(fā)現(xiàn),對(duì)于短作業(yè)可能可以在第一級(jí)隊(duì)列很快被處理完。對(duì)于長(zhǎng)作業(yè),如果在第一級(jí)隊(duì)列處理不完,可以移入下次隊(duì)列等待被執(zhí)行,雖然等待的時(shí)間變長(zhǎng)了,但是運(yùn)行時(shí)間也會(huì)更長(zhǎng)了,所以該算法很好的兼顧了長(zhǎng)短作業(yè),同時(shí)有較好的響應(yīng)時(shí)間。
辦理業(yè)務(wù)的客戶相當(dāng)于進(jìn)程,銀行窗口工作人員相當(dāng)于 CPU。 現(xiàn)在,假設(shè)這個(gè)銀行只有一個(gè)窗口(單核 CPU ),那么工作人員一次只能處理一個(gè)業(yè)務(wù)。 ![]() 那么最簡(jiǎn)單的處理方式,就是先來的先處理,后面來的就乖乖排隊(duì),這就是先來先服務(wù)(FCFS)調(diào)度算法。但是萬一先來的這位老哥是來貸款的,這一談就好幾個(gè)小時(shí),一直占用著窗口,這樣后面的人只能干等,或許后面的人只是想簡(jiǎn)單的取個(gè)錢,幾分鐘就能搞定,卻因?yàn)榍懊胬细甾k長(zhǎng)業(yè)務(wù)而要等幾個(gè)小時(shí),你說氣不氣人? ![]() 有客戶抱怨了,那我們就要改進(jìn),我們干脆優(yōu)先給那些幾分鐘就能搞定的人辦理業(yè)務(wù),這就是短作業(yè)優(yōu)先(SJF)調(diào)度算法。聽起來不錯(cuò),但是依然還是有個(gè)極端情況,萬一辦理短業(yè)務(wù)的人非常的多,這會(huì)導(dǎo)致長(zhǎng)業(yè)務(wù)的人一直得不到服務(wù),萬一這個(gè)長(zhǎng)業(yè)務(wù)是個(gè)大客戶,那不就撿了芝麻丟了西瓜 ![]() 那就公平起見,現(xiàn)在窗口工作人員規(guī)定,每個(gè)人我只處理 10 分鐘。如果 10 分鐘之內(nèi)處理完,就馬上換下一個(gè)人。如果沒處理完,依然換下一個(gè)人,但是客戶自己得記住辦理到哪個(gè)步驟了。這個(gè)也就是時(shí)間片輪轉(zhuǎn)(RR)調(diào)度算法。但是如果時(shí)間片設(shè)置過短,那么就會(huì)造成大量的上下文切換,增大了系統(tǒng)開銷。如果時(shí)間片過長(zhǎng),相當(dāng)于退化成退化成 FCFS 算法了。 ![]() 既然公平也可能存在問題,那銀行就對(duì)客戶分等級(jí),分為普通客戶、VIP 客戶、SVIP 客戶。只要高優(yōu)先級(jí)的客戶一來,就第一時(shí)間處理這個(gè)客戶,這就是最高優(yōu)先級(jí)(HPF)調(diào)度算法。但依然也會(huì)有極端的問題,萬一當(dāng)天來的全是高級(jí)客戶,那普通客戶不是沒有被服務(wù)的機(jī)會(huì),不把普通客戶當(dāng)人是嗎?那我們把優(yōu)先級(jí)改成動(dòng)態(tài)的,如果客戶辦理業(yè)務(wù)時(shí)間增加,則降低其優(yōu)先級(jí),如果客戶等待時(shí)間增加,則升高其優(yōu)先級(jí)。 ![]() 那有沒有兼顧到公平和效率的方式呢?這里介紹一種算法,考慮的還算充分的,多級(jí)反饋隊(duì)列(MFQ)調(diào)度算法,它是時(shí)間片輪轉(zhuǎn)算法和優(yōu)先級(jí)算法的綜合和發(fā)展。它的工作方式: ![]()
可以發(fā)現(xiàn),對(duì)于要辦理短業(yè)務(wù)的客戶來說,可以很快的輪到并解決。對(duì)于要辦理長(zhǎng)業(yè)務(wù)的客戶,一下子解決不了,就可以放到下一個(gè)隊(duì)列,雖然等待的時(shí)間稍微變長(zhǎng)了,但是輪到自己的辦理時(shí)間也變長(zhǎng)了,也可以接受,不會(huì)造成極端的現(xiàn)象,可以說是綜合上面幾種算法的優(yōu)點(diǎn)。
|
|
|