golang源碼解讀,go源碼剖析

本文目錄一覽：

1、golang map源碼淺析
2、Golang 網路編程絲綢之路 – TCP/UDP 地址解析
3、Golang database/sql源碼分析
4、golang unicode/utf8源碼分析

golang map源碼淺析

golang 中 map的實現結構為：哈希表 + 鏈表。其中鏈表，作用是當發生hash衝突時，拉鏈法生成的結點。

可以看到， []bmap 是一個hash table，每一個 bmap是我們常說的「桶」。經過hash 函數計算出來相同的hash值，放到相同的桶中。一個 bmap中可以存放 8個元素，如果多出8個，則生成新的結點，尾接到隊尾。

以上是只是靜態文件 src/runtime/map.go 中的定義。實際上編譯期間會給它加料，動態地創建一個新的結構：

上圖就是 bmap的內存模型， HOB Hash 指的就是 top hash。注意到 key 和 value 是各自放在一起的，並不是 key/value/key/value/… 這樣的形式。源碼里說明這樣的好處是在某些情況下可以省略掉 padding 欄位，節省內存空間。

每個 bmap設計成最多只能放 8 個 key-value 對，如果有第 9 個 key-value 落入當前的 bmap，那就需要再構建一個 bmap，通過 overflow 指針連接起來。

map創建方法:

我們實際上是通過調用的 makemap ，來創建map的。實際工作只是初始化了hmap中的各種欄位，如：設置B的大小，設置hash 種子 hash 0.

注意 :

makemap 返回是*hmap 指針，即 map 是引用對象，對map的操作會影響到結構體內部。

使用方式

對應的是下面兩種方法

map的key的類型，實現了自己的hash 方式。每種類型實現hash函數方式不一樣。

key 經過哈希計算後得到hash值，共 64 個 bit 位。其中後B 個bit位置，用來定位當前元素落在哪一個桶里，高8個bit 為當前 hash 值的top hash。實際上定位key的過程是一個雙重循環的過程，外層循環遍歷所有的overflow，內層循環遍歷當前bmap 中的 8個元素。

舉例說明：如果當前 B 的值為 5，那麼buckets 的長度為 2^5 = 32。假設有個key 經過hash函數計算後，得到的hash結果為：

外層遍歷bucket 中的鏈表

內層循環遍歷 bmap中的8個 cell

建議先不看此部分內容，看完後續修改 map中元素 – 擴容操作後再回頭看此部分內容。

擴容前的數據：

等量擴容後的數據：

等量擴容後，查找方式和原本相同，不多做贅述。

兩倍擴容後的數據

兩倍擴容後，oldbuckets 的元素，可能被分配成了兩部分。查找順序如下：

此處只分析 mapaccess1 ,。 mapaccess2 相比 mapaccess1 多添加了是否找到的bool值，有興趣可自行看一下。

使用方式：

步驟如下：

擴容條件：

擴容的標識： h.oldbuckets ！= nil

假設當前定位到了新的buckets的3號桶中，首先會判斷oldbuckets中的對應的桶有沒有被搬遷過。如果搬遷過了，不需要看原來的桶了，直接遍歷新的buckets的3號桶。

擴容前：

等量擴容結果

雙倍擴容會將old buckets上的元素分配到x， y兩個部key 1 B == 0 分配到x部分，key 1 B == 1 分配到y部分

注意：當前只對雙倍擴容描述，等量擴容只是重新填充了一下元素，相對位置沒有改變。

假設當前map 的B == 5，原本元素經過hash函數計算的 hash 值為：

因為雙倍擴容之後 B = B + 1，此時B == 6。key 1 B == 1, 即當前元素rehash到高位，新buckets中 y 部分. 否則 key 1 B == 0 則rehash到低位，即x 部分。

使用方式：

可以看到，每一遍歷生成迭代器的時候，會隨機選取一個bucket 以及一個cell開始。從前往後遍歷，再次遍歷到起始位置時，遍歷完成。

Golang 網路編程絲綢之路 – TCP/UDP 地址解析

TL;DR 在使用 Golang 編寫 TCP/UDP socket 的時候，第一步做的就是地址解析。

該函數返回的地址包含的信息如下：

TCPAddr 里， IP 既可以是 IPv4 地址，也可以是 IPv6 地址。 Port 就是埠了。 Zone 是 IPv6 本地地址所在的區域。

從返回結果看該函數的參數， network 指 address 的網路類型； address 指要解析的地址，會從中解析出我們想要的 IP , Port 和 Zone 。

從源碼中可以看出，參數 network 只能是如下四個值，否則會得到一個錯誤。

解析過程跟 ResolveTCPAddr 的一樣，不過得到的是 *UDPAddr 。

UDPAddr 包含的信息如下：

Golang database/sql源碼分析

Gorm是Go語言開發用的比較多的一個ORM。它的功能比較全：

但是這篇文章中並不會直接看Gorm的源碼，我們會先從database/sql分析。原因是Gorm也是基於這個包來封裝的一些功能。所以只有先了解了database/sql包才能更加好的理解Gorm源碼。

database/sql 其實也是一個對於mysql驅動的上層封裝。」github.com/go-sql-driver/mysql」就是一個對於mysql的驅動，database/sql 就是在這個基礎上做的基本封裝包含連接池的使用

下面這個是最基本的增刪改查操作

操作分下面幾個步驟：

因為Gorm的連接池就是使用database/sql包中的連接池，所以這裡我們需要學習一下包里的連接池的源碼實現。其實所有連接池最重要的就是連接池對象、獲取函數、釋放函數下面來看一下database/sql中的連接池。

DB對象

獲取方法

釋放連接方法

連接池的實現有很多方法，在database/sql包中使用的是chan阻塞使用map記錄等待列表，等到有連接釋放的時候再把連接傳入等待列表中的chan 不在阻塞返回連接。

之前我們看到的Redigo是使用一個chan 來阻塞，然後釋放的時候放入空閑列表，在往這一個chan中傳入struct{}{}，讓程序繼續獲取的時候再從空閑列表中獲取。並且使用的是鏈表的結構來存儲空閑列表。

database/sql 是對於mysql驅動的封裝，然而Gorm則是對於database/sql的再次封裝。讓我們可以更加簡單的實現對於mysql資料庫的操作。

golang unicode/utf8源碼分析

包 utf-8 實現的功能和常量用於文章utf8編碼,包含runes和utf8位元組序列的轉換功能.在unicode中，一個中文佔兩個位元組，utf-8中一個中文佔三個位元組，golang默認的編碼是utf-8編碼，因此默認一個中文佔三個位元組，但是golang中的字元串底層實際上是一個byte數組.

Output:

RuneSelf該值的位元組碼值為128，在判斷是否是常規的ascii碼是使用。hicb位元組碼值為191. FF 的對應的位元組碼為255。

計算字元串中的rune數量,原理：首先取出字元串的碼值，然後判斷是不是個小於128的，如果是小於則直接continue.rune個數++.

如果是個十六進位f1.的則是無效字元，直接continue.rune個數++,也就是說一個無效的字元也當成一個字長為1的rune.如果字元的碼值在first列表中的值和7按位的結果為其字長，比如上面示例中的鋼。其字長為三位，第一位的值為 233 .二進位形式為 11101001 ;與7按位與後的值為0.從acceptRanges中取出的結果為{locb, hicb}。也就是標識 ox80 到 0xbf 之間的值。而結果n也就是直接size+3跳過3個位元組後，rune個數++。其他函數的處理流程差不多，不再過多敘述。

示例：

ValidString返回值表明參數字元串是否是一個合法的可utf8編碼的字元串。

RuneCount返回參數中包含的rune數量,第一個例子中將 utf8.RuneCountInString ,改成該方法調用，返回的結果相同。錯誤的和短的被當成一個長一位元組的rune.單個字元 H 就表示一個長度為1位元組的rune.

該函數標識參數是否以一個可編碼的rune開頭,上面的例子中，因為字元串是以一個ascii碼值在0-127內的字元開頭，所以在執行

first[p[0]] 時，取到的是 p[0] 是72,在first列表中，127之前的值都相同都為 0xF0 ,十進位標識為240，與7按位與後值為0，所以，直接返回 true .

和FullRune類似，只是參數為字元串形式

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/302908.html