本文目錄一覽:
golang協程調度模式解密
golang學習筆記
頻繁創建線程會造成不必要的開銷,所以才有了線程池。在線程池中預先保存一定數量的線程,新任務發布到任務隊列,線程池中的線程不斷地從任務隊列中取出任務並執行,可以有效的減少創建和銷毀帶來的開銷。
過多的線程會導致爭搶cpu資源,且上下文的切換的開銷變大。而工作在用戶態的協程能大大減少上下文切換的開銷。協程調度器把可運行的協程逐個調度到線程中執行,同時即時把阻塞的協程調度出協程,從而有效地避免了線程的頻繁切換,達到了少量線程實現高並發的效果。
多個協程分享操作系統分給線程的時間片,從而達到充分利用CPU的目的,協程調度器決定了則決定了協程運行的順序。每個線程同一時刻只能運行一個協程。
go調度模型包含三個實體:
每個處理器維護者一個協程G的隊列,處理器依次將協程G調度到M中執行。
每個P會周期性地查看全局隊列中是否有G待運行並將其調度到M中執行,全局隊列中的G主要來自系統調用中恢復的G.
如果協程發起系統調用,則整個工作線程M被阻塞,協程隊列中的其他協程都會阻塞。
一般情況下M的個數會略大於P個數,多出來的M將會在G產生系統調用時發揮作用。與線程池類似,Go也提供M池子。當協程G1發起系統掉用時,M1會釋放P,由 M1-P-G1 G2 … 轉變成 M1-G1 , M2會接管P的其他協程 M2-P-G2 G3 G4… 。
冗餘的M可能來源於緩存池,也可能是新建的。
當G1結束系統調用後,根據M1是否獲取到P,進行不用的處理。
多個處理P維護隊列可能不均衡,導致部分處理器非常繁忙,而其餘相對空閑。產生原因是有些協程自身不斷地派生協程。
為此Go調度器提供了工作量竊取策略,當某個處理器P沒有需要調度的協程時,將從其他處理中偷取協程,每次偷取一半。
搶佔式調度,是指避免某個協程長時間執行,而阻礙其他協程被調度的機制。
調度器監控每個協程執行時間,一旦執行時間過長且有其他協程等待,會把協程暫停,轉而調度等待的協程,以達到類似時間片輪轉的效果。比如for循環會一直佔用執行權。
在IO密集型應用,GOMAXPROCS大小設置大一些,獲取性能會更好。
IO密集型會經常發生系統調用,會有一個新的M啟用或創建,但由於Go調度器檢測M到被阻塞有一定延遲。如果P數量多,則P管理協程隊列會變小。
golang csp 模型
調度器 由三方面實體構成:
三者對應關係:
上圖有2個 物理線程 M,每一個 M 都擁有一個上下文(P),每一個也都有一個正在運行的goroutine(G)。
P 的數量可由 runtime.GOMAXPROCS() 進行設置,它代表了真正的並發能力,即可有多少個 goroutine 同時運行。
調度器為什麼要維護多個上下文P 呢? 因為當一個物理線程 M 被阻塞時,P 可以轉而投奔另一個OS線程 M (即 P 帶著 G 連莖拔起,去另一個 M 節點下運行)。這是 Golang調度器厲害的地方,也是高並發能力的保障。
Golang 語言深入理解:channel
本文是對 Gopher 2017 中一個非常好的 Talk�: [Understanding Channel](GopherCon 2017: Kavya Joshi – Understanding Channels) 的學習筆記,希望能夠通過對 channel 的關鍵特性的理解,進一步掌握其用法細節以及 Golang 語言設計哲學的管窺蠡測。
channel 是可以讓一個 goroutine 發送特定值到另一個 gouroutine 的通信機制。
原生的 channel 是沒有緩存的(unbuffered channel),可以用於 goroutine 之間實現同步。
關閉後不能再寫入,可以讀取直到 channel 中再沒有數據,並返回元素類型的零值。
gopl/ch3/netcat3
首先從 channel 是怎麼被創建的開始:
在 heap 上分配一個 hchan 類型的對象,並將其初始化,然後返回一個指向這個 hchan 對象的指針。
理解了 channel 的數據結構實現,現在轉到 channel 的兩個最基本方法: sends 和 receivces ,看一下以上的特性是如何體現在 sends 和 receives 中的:
假設發送方先啟動,執行 ch – task0 :
如此為 channel 帶來了 goroutine-safe 的特性。
在這樣的模型里, sender goroutine – channel – receiver goroutine 之間, hchan 是唯一的共享內存,而這個唯一的共享內存又通過 mutex 來確保 goroutine-safe ,所有在隊列中的內容都只是副本。
這便是著名的 golang 並發原則的體現:
發送方 goroutine 會阻塞,暫停,並在收到 receive 後才恢復。
goroutine 是一種 用戶態線程 , 由 Go runtime 創建並管理,而不是操作系統,比起操作系統線程來說,goroutine更加輕量。
Go runtime scheduler 負責將 goroutine 調度到操作系統線程上。
runtime scheduler 怎麼將 goroutine 調度到操作系統線程上?
當阻塞發生時,一次 goroutine 上下文切換的全過程:
然而,被阻塞的 goroutine 怎麼恢復過來?
阻塞發生時,調用 runtime sheduler 執行 gopark 之前,G1 會創建一個 sudog ,並將它存放在 hchan 的 sendq 中。 sudog 中便記錄了即將被阻塞的 goroutine G1 ,以及它要發送的數據元素 task4 等等。
接收方 將通過這個 sudog 來恢復 G1
接收方 G2 接收數據, 並發出一個 receivce ,將 G1 置為 runnable :
同樣的, 接收方 G2 會被阻塞,G2 會創建 sudoq ,存放在 recvq ,基本過程和發送方阻塞一樣。
不同的是,發送方 G1如何恢復接收方 G2,這是一個非常神奇的實現。
理論上可以將 task 入隊,然後恢復 G2, 但恢復 G2後,G2會做什麼呢?
G2會將隊列中的 task 複製出來,放到自己的 memory 中,基於這個思路,G1在這個時候,直接將 task 寫到 G2的 stack memory 中!
這是違反常規的操作,理論上 goroutine 之間的 stack 是相互獨立的,只有在運行時可以執行這樣的操作。
這麼做純粹是出於性能優化的考慮,原來的步驟是:
優化後,相當於減少了 G2 獲取鎖並且執行 memcopy 的性能消耗。
channel 設計背後的思想可以理解為 simplicity 和 performance 之間權衡抉擇,具體如下:
queue with a lock prefered to lock-free implementation:
比起完全 lock-free 的實現,使用鎖的隊列實現更簡單,容易實現
golang的線程模型——GMP模型
內核線程(Kernel-Level Thread ,KLT)
輕量級進程(Light Weight Process,LWP):輕量級進程就是我們通常意義上所講的線程,由於每個輕量級進程都由一個內核線程支持,因此只有先支持內核線程,才能有輕量級進程
用戶線程與系統線程一一對應,用戶線程執行如lo操作的系統調用時,來回切換操作開銷相對比較大
多個用戶線程對應一個內核線程,當內核線程對應的一個用戶線程被阻塞掛起時候,其他用戶線程也阻塞不能執行了。
多對多模型是可以充分利用多核CPU提升運行效能的
go線程模型包含三個概念:內核線程(M),goroutine(G),G的上下文環境(P);
GMP模型是goalng特有的。
P與M一般是一一對應的。P(上下文)管理著一組G(goroutine)掛載在M(內核線程)上運行,圖中左邊藍色為正在執行狀態的goroutine,右邊為待執行狀態的goroutiine隊列。P的數量由環境變數GOMAXPROCS的值或程序運行runtime.GOMAXPROCS()進行設置。
當一個os線程在執行M1一個G1發生阻塞時,調度器讓M1拋棄P,等待G1返回,然後另起一個M2接收P來執行剩下的goroutine隊列(G2、G3…),這是golang調度器厲害的地方,可以保證有足夠的線程來運行剩下所有的goroutine。
當G1結束後,M1會重新拿回P來完成,如果拿不到就丟到全局runqueue中,然後自己放到線程池或轉入休眠狀態。空閑的上下文P會周期性的檢查全局runqueue上的goroutine,並且執行它。
另一種情況就是當有些P1太閑而其他P2很忙碌的時候,會從其他上下文P2拿一些G來執行。
詳細可以翻看下方第一個參考鏈接,寫得真好。
最後用大佬的總結來做最後的收尾————
Go語言運行時,通過核心元素G,M,P 和 自己的調度器,實現了自己的並發線程模型。調度器通過對G,M,P的調度實現了兩級線程模型中操作系統內核之外的調度任務。整個調度過程中會在多種時機去觸發最核心的步驟 「一整輪調度」,而一整輪調度中最關鍵的部分在「全力查找可運行G」,它保證了M的高效運行(換句話說就是充分使用了計算機的物理資源),一整輪調度中還會涉及到M的啟用停止。最後別忘了,還有一個與Go程序生命周期相同的系統監測任務來進行一些輔助性的工作。
淺析Golang的線程模型與調度器
Golang CSP並發模型
Golang線程模型
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/272481.html