2、Golang的協程調度器原理及GMP設計思想？ · Golang修養之路

[TOC] ## 2、Golang的協程調度器原理及GMP設計思想？ > 本節為**重點**章節 > 本章節含視頻版: [![](https://img.kancloud.cn/8c/36/8c367cb1f4ce2839f6ebc2f909372eba_1362x692.png)](https://www.bilibili.com/video/BV19r4y1w7Nx) --- ## 一、Golang“調度器”的由來？ ### (1) 單進程時代不需要調度器我們知道，一切的軟件都是跑在操作系統上，真正用來干活(計算)的是CPU。早期的操作系統每個程序就是一個進程，知道一個程序運行完，才能進行下一個進程，就是“單進程時代” 一切的程序只能串行發生。 ![](https://img.kancloud.cn/30/f7/30f77ecceb7ae3b3f0911bf7c8904599_1586x1184.png) 早期的單進程操作系統，面臨2個問題： 1.單一的執行流程，計算機只能一個任務一個任務處理。 2.進程阻塞所帶來的CPU時間浪費。那么能不能有多個進程來宏觀一起來執行多個任務呢？后來操作系統就具有了**最早的并發能力：多進程并發**，當一個進程阻塞的時候，切換到另外等待執行的進程，這樣就能盡量把CPU利用起來，CPU就不浪費了。 ### (2)多進程/線程時代有了調度器需求 ![](https://img.kancloud.cn/de/49/de49ef2a1ef0fc553754b5ea87e133a6_1522x1332.png) 在多進程/多線程的操作系統中，就解決了阻塞的問題，因為一個進程阻塞cpu可以立刻切換到其他進程中去執行，而且調度cpu的算法可以保證在運行的進程都可以被分配到cpu的運行時間片。這樣從宏觀來看，似乎多個進程是在同時被運行。但新的問題就又出現了，進程擁有太多的資源，進程的創建、切換、銷毀，都會占用很長的時間，CPU雖然利用起來了，但如果進程過多，CPU有很大的一部分都被用來進行進程調度了。 **怎么才能提高CPU的利用率呢？** 但是對于Linux操作系統來講，cpu對進程的態度和線程的態度是一樣的。 ![](https://img.kancloud.cn/b1/d1/b1d10153ae6c22754d38328379fa395f_1442x976.png) 很明顯，CPU調度切換的是進程和線程。盡管線程看起來很美好，但實際上多線程開發設計會變得更加復雜，要考慮很多同步競爭等問題，如鎖、競爭沖突等。 ### (3)協程來提高CPU利用率多進程、多線程已經提高了系統的并發能力，但是在當今互聯網高并發場景下，為每個任務都創建一個線程是不現實的，因為會消耗大量的內存(進程虛擬內存會占用4GB[32位操作系統], 而線程也要大約4MB)。大量的進程/線程出現了新的問題 * 高內存占用 * 調度的高消耗CPU 好了，然后工程師們就發現，其實一個線程分為“內核態“線程和”用戶態“線程。一個“用戶態線程”必須要綁定一個“內核態線程”，但是CPU并不知道有“用戶態線程”的存在，它只知道它運行的是一個“內核態線程”(Linux的PCB進程控制塊)。 ![](https://img.kancloud.cn/47/e3/47e396eea8f0e71532356197412d52f1_1294x1106.png) ? ? 這樣，我們再去細化去分類一下，內核線程依然叫“線程(thread)”，用戶線程叫“協程(co-routine)". ![](https://img.kancloud.cn/45/9d/459db145d4e702994548a1757238946f_1248x1064.png) ? 看到這里，我們就要開腦洞了，既然一個協程(co-routine)可以綁定一個線程(thread)，那么能不能多個協程(co-routine)綁定一個或者多個線程(thread)上呢。 ? 之后，我們就看到了有3中協程和線程的映射關系： > #### N:1關系 N個協程綁定1個線程，優點就是**協程在用戶態線程即完成切換，不會陷入到內核態，這種切換非常的輕量快速**。但也有很大的缺點，1個進程的所有協程都綁定在1個線程上缺點： * 某個程序用不了硬件的多核加速能力 * 一旦某協程阻塞，造成線程阻塞，本進程的其他協程都無法執行了，根本就沒有并發的能力了。 ![](https://img.kancloud.cn/f8/d7/f8d715899f6db333d37f2bf738116bfd_1352x1092.png) > #### 1:1 關系 1個協程綁定1個線程，這種最容易實現。協程的調度都由CPU完成了，不存在N:1缺點，缺點： * 協程的創建、刪除和切換的代價都由CPU完成，有點略顯昂貴了。 ![](https://img.kancloud.cn/cf/9a/cf9a59f9776bf4c9cbbad6103b6c5e5a_1322x1112.png) > #### M:N關系 M個協程綁定1個線程，是N:1和1:1類型的結合，克服了以上2種模型的缺點，但實現起來最為復雜。 ![](https://img.kancloud.cn/00/37/0037f6c2e12ad82a912990bba3e0085c_1336x1112.png) ? 協程跟線程是有區別的，線程由CPU調度是搶占式的，**協程由用戶態調度是協作式的**，一個協程讓出CPU后，才執行下一個協程。 ? ### (4)Go語言的協程goroutine **Go為了提供更容易使用的并發方法，使用了goroutine和channel**。goroutine來自協程的概念，讓一組可復用的函數運行在一組線程之上，即使有協程阻塞，該線程的其他協程也可以被`runtime`調度，轉移到其他可運行的線程上。最關鍵的是，程序員看不到這些底層的細節，這就降低了編程的難度，提供了更容易的并發。 Go中，協程被稱為goroutine，它非常輕量，一個goroutine只占幾KB，并且這幾KB就足夠goroutine運行完，這就能在有限的內存空間內支持大量goroutine，支持了更多的并發。雖然一個goroutine的棧只占幾KB，但實際是可伸縮的，如果需要更多內容，`runtime`會自動為goroutine分配。 Goroutine特點： * 占用內存更小（幾kb） * 調度更靈活(runtime調度) ### (5)被廢棄的goroutine調度器 ? 好了，既然我們知道了協程和線程的關系，那么最關鍵的一點就是調度協程的調度器的實現了。 Go目前使用的調度器是2012年重新設計的，因為之前的調度器性能存在問題，所以使用4年就被廢棄了，那么我們先來分析一下被廢棄的調度器是如何運作的？ > 大部分文章都是會用G來表示Goroutine，用M來表示線程，那么我們也會用這種表達的對應關系。 ![](https://img.kancloud.cn/e1/49/e1499cd06be0cdbee19ac4ada8537326_984x738.png) ? 下面我們來看看被廢棄的golang調度器是如何實現的？ ![](https://img.kancloud.cn/bd/cd/bdcdc5e6fcb03244a9843333cca62378_1292x860.png) ? M想要執行、放回G都必須訪問全局G隊列，并且M有多個，即多線程訪問同一資源需要加鎖進行保證互斥/同步，所以全局G隊列是有互斥鎖進行保護的。老調度器有幾個缺點： 1. 創建、銷毀、調度G都需要每個M獲取鎖，這就形成了**激烈的鎖競爭**。 2. M轉移G會造成**延遲和額外的系統負載**。比如當G中包含創建新協程的時候，M創建了G’，為了繼續執行G，需要把G’交給M’執行，也造成了**很差的局部性**，因為G’和G是相關的，最好放在M上執行，而不是其他M'。 3. 系統調用(CPU在M之間的切換)導致頻繁的線程阻塞和取消阻塞操作增加了系統開銷。 ## 二、Goroutine調度器的GMP模型的設計思想面對之前調度器的問題，Go設計了新的調度器。在新調度器中，出列M(thread)和G(goroutine)，又引進了P(Processor)。 ![](https://img.kancloud.cn/6b/db/6bdb04101cc63565c17cd8fcaba17321_1068x876.png) **Processor，它包含了運行goroutine的資源**，如果線程想運行goroutine，必須先獲取P，P中還包含了可運行的G隊列。 ### (1)GMP模型在Go中，**線程是運行goroutine的實體，調度器的功能是把可運行的goroutine分配到工作線程上**。 ![](https://img.kancloud.cn/eb/fe/ebfe3e28315f12a08fbb4ffaee32e046_1024x768.png) 1. **全局隊列**（Global Queue）：存放等待運行的G。 2. **P的本地隊列**：同全局隊列類似，存放的也是等待運行的G，存的數量有限，不超過256個。新建G'時，G'優先加入到P的本地隊列，如果隊列滿了，則會把本地隊列中一半的G移動到全局隊列。 3. **P列表**：所有的P都在程序啟動時創建，并保存在數組中，最多有`GOMAXPROCS`(可配置)個。 4. **M**：線程想運行任務就得獲取P，從P的本地隊列獲取G，P隊列為空時，M也會嘗試從全局隊列**拿**一批G放到P的本地隊列，或從其他P的本地隊列**偷**一半放到自己P的本地隊列。M運行G，G執行之后，M會從P獲取下一個G，不斷重復下去。 **Goroutine調度器和OS調度器是通過M結合起來的，每個M都代表了1個內核線程，OS調度器負責把內核線程分配到CPU的核上執行**。 > #### 有關P和M的個數問題 1、P的數量： - 由啟動時環境變量`$GOMAXPROCS`或者是由`runtime`的方法`GOMAXPROCS()`決定。這意味著在程序執行的任意時刻都只有`$GOMAXPROCS`個goroutine在同時運行。 2、M的數量: - go語言本身的限制：go程序啟動時，會設置M的最大數量，默認10000.但是內核很難支持這么多的線程數，所以這個限制可以忽略。 - runtime/debug中的SetMaxThreads函數，設置M的最大數量 - 一個M阻塞了，會創建新的M。 M與P的數量沒有絕對關系，一個M阻塞，P就會去創建或者切換另一個M，所以，即使P的默認數量是1，也有可能會創建很多個M出來。 > #### P和M何時會被創建 1、P何時創建：在確定了P的最大數量n后，運行時系統會根據這個數量創建n個P。 2、M何時創建：沒有足夠的M來關聯P并運行其中的可運行的G。比如所有的M此時都阻塞住了，而P中還有很多就緒任務，就會去尋找空閑的M，而沒有空閑的，就會去創建新的M。 ### (2)調度器的設計策略 **復用線程**：避免頻繁的創建、銷毀線程，而是對線程的復用。 1）work stealing機制 ? 當本線程無可運行的G時，嘗試從其他線程綁定的P偷取G，而不是銷毀線程。 2）hand off機制 ? 當本線程因為G進行系統調用阻塞時，線程釋放綁定的P，把P轉移給其他空閑的線程執行。 **利用并行**：`GOMAXPROCS`設置P的數量，最多有`GOMAXPROCS`個線程分布在多個CPU上同時運行。`GOMAXPROCS`也限制了并發的程度，比如`GOMAXPROCS = 核數/2`，則最多利用了一半的CPU核進行并行。 **搶占**：在coroutine中要等待一個協程主動讓出CPU才執行下一個協程，在Go中，一個goroutine最多占用CPU 10ms，防止其他goroutine被餓死，這就是goroutine不同于coroutine的一個地方。 **全局G隊列**：在新的調度器中依然有全局G隊列，但功能已經被弱化了，當M執行work stealing從其他P偷不到G時，它可以從全局G隊列獲取G。 ### (3) go func() 調度流程 ![](https://img.kancloud.cn/76/4f/764f7be119026cc16314e87628e4013f_1920x1080.jpeg) 從上圖我們可以分析出幾個結論： ? 1、我們通過 go func()來創建一個goroutine； ? 2、有兩個存儲G的隊列，一個是局部調度器P的本地隊列、一個是全局G隊列。新創建的G會先保存在P的本地隊列中，如果P的本地隊列已經滿了就會保存在全局的隊列中； ? 3、G只能運行在M中，一個M必須持有一個P，M與P是1：1的關系。M會從P的本地隊列彈出一個可執行狀態的G來執行，如果P的本地隊列為空，就會想其他的MP組合偷取一個可執行的G來執行； ? 4、一個M調度G執行的過程是一個循環機制； ? 5、當M執行某一個G時候如果發生了syscall或則其余阻塞操作，M會阻塞，如果當前有一些G在執行，runtime會把這個線程M從P中摘除(detach)，然后再創建一個新的操作系統的線程(如果有空閑的線程可用就復用空閑線程)來服務于這個P； ? 6、當M系統調用結束時候，這個G會嘗試獲取一個空閑的P執行，并放入到這個P的本地隊列。如果獲取不到P，那么這個線程M變成休眠狀態，加入到空閑線程中，然后這個G會被放入全局隊列中。 ### (4)調度器的生命周期 ![](https://img.kancloud.cn/b3/10/b31027eeb493fa86654b41d46f34a98b_439x872.png) 特殊的M0和G0 **M0** `M0`是啟動程序后的編號為0的主線程，這個M對應的實例會在全局變量runtime.m0中，不需要在heap上分配，M0負責執行初始化操作和啟動第一個G，在之后M0就和其他的M一樣了。 **G0** `G0`是每次啟動一個M都會第一個創建的gourtine，G0僅用于負責調度的G，G0不指向任何可執行的函數, 每個M都會有一個自己的G0。在調度或系統調用時會使用G0的棧空間, 全局變量的G0是M0的G0。我們來跟蹤一段代碼 ```go package main import "fmt" func main() { fmt.Println("Hello world") } ``` 接下來我們來針對上面的代碼對調度器里面的結構做一個分析。也會經歷如上圖所示的過程： 1. runtime創建最初的線程m0和goroutine g0，并把2者關聯。 2. 調度器初始化：初始化m0、棧、垃圾回收，以及創建和初始化由GOMAXPROCS個P構成的P列表。 3. 示例代碼中的main函數是`main.main`，`runtime`中也有1個main函數——`runtime.main`，代碼經過編譯后，`runtime.main`會調用`main.main`，程序啟動時會為`runtime.main`創建goroutine，稱它為main goroutine吧，然后把main goroutine加入到P的本地隊列。 4. 啟動m0，m0已經綁定了P，會從P的本地隊列獲取G，獲取到main goroutine。 5. G擁有棧，M根據G中的棧信息和調度信息設置運行環境 6. M運行G 7. G退出，再次回到M獲取可運行的G，這樣重復下去，直到`main.main`退出，`runtime.main`執行Defer和Panic處理，或調用`runtime.exit`退出程序。調度器的生命周期幾乎占滿了一個Go程序的一生，`runtime.main`的goroutine執行之前都是為調度器做準備工作，`runtime.main`的goroutine運行，才是調度器的真正開始，直到`runtime.main`結束而結束。 ### (5)可視化GMP編程有2種方式可以查看一個程序的GMP的數據。 **方式1：go tool trace** trace記錄了運行時的信息，能提供可視化的Web頁面。簡單測試代碼：main函數創建trace，trace會運行在單獨的goroutine中，然后main打印"Hello World"退出。 > trace.go ```go package main import ( "os" "fmt" "runtime/trace" ) func main() { //創建trace文件 f, err := os.Create("trace.out") if err != nil { panic(err) } defer f.Close() //啟動trace goroutine err = trace.Start(f) if err != nil { panic(err) } defer trace.Stop() //main fmt.Println("Hello World") } ``` 運行程序 ```bash $ go run trace.go Hello World ``` 會得到一個`trace.out`文件，然后我們可以用一個工具打開，來分析這個文件。 ```golang $ go tool trace trace.out 2020/02/23 10:44:11 Parsing trace... 2020/02/23 10:44:11 Splitting trace... 2020/02/23 10:44:11 Opening browser. Trace viewer is listening on http://127.0.0.1:33479 ``` 我們可以通過瀏覽器打開`http://127.0.0.1:33479`網址，點擊`view trace` 能夠看見可視化的調度流程。 ![](https://img.kancloud.cn/ee/e8/eee828bc698d074e439f3e6929be74ef_2724x546.png) ![](https://img.kancloud.cn/25/ed/25ede16ec870076f211f8924c2c2bf6f_492x556.png) **G信息** 點擊Goroutines那一行可視化的數據條，我們會看到一些詳細的信息。 ![](https://img.kancloud.cn/87/e3/87e3994fbda4e883a8c51bea20dba91a_1168x372.png) ? 一共有兩個G在程序中，一個是特殊的G0，是每個M必須有的一個初始化的G，這個我們不必討論。其中G1應該就是main goroutine(執行main函數的協程)，在一段時間內處于可運行和運行的狀態。 **M信息** 點擊Threads那一行可視化的數據條，我們會看到一些詳細的信息。 ![](https://img.kancloud.cn/88/4f/884f6aa775a4596d3c8d4f9451d55e9b_1146x248.png) ? 一共有兩個M在程序中，一個是特殊的M0，用于初始化使用，這個我們不必討論。 **P信息** ![](https://img.kancloud.cn/5e/07/5e07a8515a023fcd10fbd8cf328b5d64_2736x224.png) G1中調用了`main.main`，創建了`trace goroutine g18`。G1運行在P1上，G18運行在P0上。這里有兩個P，我們知道，一個P必須綁定一個M才能調度G。我們在來看看上面的M信息。 ![](https://img.kancloud.cn/6e/14/6e145c4c49656b77f9f2006733b88859_2142x466.png) 我們會發現，確實G18在P0上被運行的時候，確實在Threads行多了一個M的數據，點擊查看如下： ![](https://img.kancloud.cn/19/60/19602c163ecfe63706e10cdc90e43794_1086x298.png) 多了一個M2應該就是P0為了執行G18而動態創建的M2. **方式2：Debug trace** ```go package main import ( "fmt" "time" ) func main() { for i := 0; i < 5; i++ { time.Sleep(time.Second) fmt.Println("Hello World") } } ``` 編譯 ```bash $ go build trace2.go ``` 通過Debug方式運行 ```bash $ GODEBUG=schedtrace=1000 ./trace2 SCHED 0ms: gomaxprocs=2 idleprocs=0 threads=4 spinningthreads=1 idlethreads=1 runqueue=0 [0 0] Hello World SCHED 1003ms: gomaxprocs=2 idleprocs=2 threads=4 spinningthreads=0 idlethreads=2 runqueue=0 [0 0] Hello World SCHED 2014ms: gomaxprocs=2 idleprocs=2 threads=4 spinningthreads=0 idlethreads=2 runqueue=0 [0 0] Hello World SCHED 3015ms: gomaxprocs=2 idleprocs=2 threads=4 spinningthreads=0 idlethreads=2 runqueue=0 [0 0] Hello World SCHED 4023ms: gomaxprocs=2 idleprocs=2 threads=4 spinningthreads=0 idlethreads=2 runqueue=0 [0 0] Hello World ``` - `SCHED`：調試信息輸出標志字符串，代表本行是goroutine調度器的輸出； - `0ms`：即從程序啟動到輸出這行日志的時間； - `gomaxprocs`: P的數量，本例有2個P, 因為默認的P的屬性是和cpu核心數量默認一致，當然也可以通過GOMAXPROCS來設置； - `idleprocs`: 處于idle狀態的P的數量；通過gomaxprocs和idleprocs的差值，我們就可知道執行go代碼的P的數量； - t`hreads: os threads/M`的數量，包含scheduler使用的m數量，加上runtime自用的類似sysmon這樣的thread的數量； - `spinningthreads`: 處于自旋狀態的os thread數量； - `idlethread`: 處于idle狀態的os thread的數量； - `runqueue=0`： Scheduler全局隊列中G的數量； - `[0 0]`: 分別為2個P的local queue中的G的數量。下一篇，我們來繼續詳細的分析GMP調度原理的一些場景問題。 ## 三、Go調度器調度場景過程全解析 ### (1)場景1 P擁有G1，M1獲取P后開始運行G1，G1使用`go func()`創建了G2，為了局部性G2優先加入到P1的本地隊列。 ![](https://img.kancloud.cn/2d/eb/2debce43683adca1acb5ca5210057232_1074x900.png) --- ### (2)場景2 G1運行完成后(函數：`goexit`)，M上運行的goroutine切換為G0，G0負責調度時協程的切換（函數：`schedule`）。從P的本地隊列取G2，從G0切換到G2，并開始運行G2(函數：`execute`)。實現了線程M1的復用。 ![](https://img.kancloud.cn/93/65/93658da22081d52ed1caf32f42145e5a_1624x984.png) --- ### (3)場景3 假設每個P的本地隊列只能存3個G。G2要創建了6個G，前3個G（G3, G4, G5）已經加入p1的本地隊列，p1本地隊列滿了。 ![](https://img.kancloud.cn/64/15/6415bfab3595fc22090595acc7c1b4b1_1104x1030.png) --- ### (4)場景4 G2在創建G7的時候，發現P1的本地隊列已滿，需要執行**負載均衡**(把P1中本地隊列中前一半的G，還有新創建G**轉移**到全局隊列) > （實現中并不一定是新的G，如果G是G2之后就執行的，會被保存在本地隊列，利用某個老的G替換新G加入全局隊列） ![](https://img.kancloud.cn/d1/27/d12776bfd5cd10f8c1979c61d467499c_1120x1068.png) 這些G被轉移到全局隊列時，會被打亂順序。所以G3,G4,G7被轉移到全局隊列。 --- ### (5)場景5 G2創建G8時，P1的本地隊列未滿，所以G8會被加入到P1的本地隊列。 ![](https://img.kancloud.cn/7a/01/7a01ac7a3a4fd14493224827409f77f8_1036x1048.png) ? G8加入到P1點本地隊列的原因還是因為P1此時在與M1綁定，而G2此時是M1在執行。所以G2創建的新的G會優先放置到自己的M綁定的P上。 --- ### (6)場景6 規定：**在創建G時，運行的G會嘗試喚醒其他空閑的P和M組合去執行**。 ![](https://img.kancloud.cn/60/6a/606acb1e4bf6b85c352b213744771601_1976x1098.png) 假定G2喚醒了M2，M2綁定了P2，并運行G0，但P2本地隊列沒有G，M2此時為自旋線程**（沒有G但為運行狀態的線程，不斷尋找G）**。 --- ### (7)場景7 M2嘗試從全局隊列(簡稱“GQ”)取一批G放到P2的本地隊列（函數：`findrunnable()`）。M2從全局隊列取的G數量符合下面的公式： ```go n = min(len(GQ) / GOMAXPROCS + 1, cap(LQ) / 2 ) ``` 相關源碼參考: ```go // 從全局隊列中偷取，調用時必須鎖住調度器 func globrunqget(_p_ *p, max int32) *g { // 如果全局隊列中沒有 g 直接返回 if sched.runqsize == 0 { return nil } // per-P 的部分，如果只有一個 P 的全部取 n := sched.runqsize/gomaxprocs + 1 if n > sched.runqsize { n = sched.runqsize } // 不能超過取的最大個數 if max > 0 && n > max { n = max } // 計算能不能在本地隊列中放下 n 個 if n > int32(len(_p_.runq))/2 { n = int32(len(_p_.runq)) / 2 } // 修改本地隊列的剩余空間 sched.runqsize -= n // 拿到全局隊列隊頭 g gp := sched.runq.pop() // 計數 n-- // 繼續取剩下的 n-1 個全局隊列放入本地隊列 for ; n > 0; n-- { gp1 := sched.runq.pop() runqput(_p_, gp1, false) } return gp } ``` 至少從全局隊列取1個g，但每次不要從全局隊列移動太多的g到p本地隊列，給其他p留點。這是**從全局隊列到P本地隊列的負載均衡**。 ![](https://img.kancloud.cn/d6/46/d646d4d213d7b603f211cd74ba0dd391_1920x1080.jpeg) ? 假定我們場景中一共有4個P（GOMAXPROCS設置為4，那么我們允許最多就能用4個P來供M使用）。所以M2只從能從全局隊列取1個G（即G3）移動P2本地隊列，然后完成從G0到G3的切換，運行G3。 --- ### (8)場景8 假設G2一直在M1上運行，經過2輪后，M2已經把G7、G4從全局隊列獲取到了P2的本地隊列并完成運行，全局隊列和P2的本地隊列都空了,如場景8圖的左半部分。 ![](https://img.kancloud.cn/8a/bf/8abf6b47b0871011b6f18f55365c1774_1632x1130.png) ? **全局隊列已經沒有G，那m就要執行work stealing(偷取)：從其他有G的P哪里偷取一半G過來，放到自己的P本地隊列**。P2從P1的本地隊列尾部取一半的G，本例中一半則只有1個G8，放到P2的本地隊列并執行。 --- ### (9)場景9 G1本地隊列G5、G6已經被其他M偷走并運行完成，當前M1和M2分別在運行G2和G8，M3和M4沒有goroutine可以運行，M3和M4處于**自旋狀態**，它們不斷尋找goroutine。 ![](https://img.kancloud.cn/10/b4/10b49d04c42c3d688986ff41005ee63b_1682x1084.png) ? 為什么要讓m3和m4自旋，自旋本質是在運行，線程在運行卻沒有執行G，就變成了浪費CPU. 為什么不銷毀現場，來節約CPU資源。因為創建和銷毀CPU也會浪費時間，我們**希望當有新goroutine創建時，立刻能有M運行它**，如果銷毀再新建就增加了時延，降低了效率。當然也考慮了過多的自旋線程是浪費CPU，所以系統中最多有`GOMAXPROCS`個自旋的線程(當前例子中的`GOMAXPROCS`=4，所以一共4個P)，多余的沒事做線程會讓他們休眠。 --- ### (10)場景10 ? 假定當前除了M3和M4為自旋線程，還有M5和M6為空閑的線程(沒有得到P的綁定，注意我們這里最多就只能夠存在4個P，所以P的數量應該永遠是M>=P, 大部分都是M在搶占需要運行的P)，G8創建了G9，G8進行了**阻塞的系統調用**，M2和P2立即解綁，P2會執行以下判斷：如果P2本地隊列有G、全局隊列有G或有空閑的M，P2都會立馬喚醒1個M和它綁定，否則P2則會加入到空閑P列表，等待M來獲取可用的p。本場景中，P2本地隊列有G9，可以和其他空閑的線程M5綁定。 ![](https://img.kancloud.cn/54/9a/549aa458fab4c3e7cac5086d9326c1d2_2642x1494.png) --- ### (11)場景11 G8創建了G9，假如G8進行了**非阻塞系統調用**。 ![](https://img.kancloud.cn/24/6c/246c03cdf1eb8307b70865d0debaa1f0_2678x1466.png) ? M2和P2會解綁，但M2會記住P2，然后G8和M2進入**系統調用**狀態。當G8和M2退出系統調用時，會嘗試獲取P2，如果無法獲取，則獲取空閑的P，如果依然沒有，G8會被記為可運行狀態，并加入到全局隊列,M2因為沒有P的綁定而變成休眠狀態(長時間休眠等待GC回收銷毀)。 --- ## 四、小結總結，Go調度器很輕量也很簡單，足以撐起goroutine的調度工作，并且讓Go具有了原生（強大）并發的能力。**Go調度本質是把大量的goroutine分配到少量線程上去執行，并利用多核并行，實現更強大的并發。** ## 五、思維導圖筆記