本文目錄一覽:
- 1、golang map源碼淺析
- 2、Golang 網路編程絲綢之路 – TCP/UDP 地址解析
- 3、Golang database/sql源碼分析
- 4、golang unicode/utf8源碼分析
golang map源碼淺析
golang 中 map的實現結構為: 哈希表 + 鏈表。 其中鏈表,作用是當發生hash衝突時,拉鏈法生成的結點。
可以看到, []bmap 是一個hash table, 每一個 bmap是我們常說的「桶」。 經過hash 函數計算出來相同的hash值, 放到相同的桶中。 一個 bmap中可以存放 8個 元素, 如果多出8個,則生成新的結點,尾接到隊尾。
以上是只是靜態文件 src/runtime/map.go 中的定義。 實際上編譯期間會給它加料 ,動態地創建一個新的結構:
上圖就是 bmap的內存模型, HOB Hash 指的就是 top hash。 注意到 key 和 value 是各自放在一起的,並不是 key/value/key/value/… 這樣的形式。源碼里說明這樣的好處是在某些情況下可以省略掉 padding 欄位,節省內存空間。
每個 bmap設計成 最多只能放 8 個 key-value 對 ,如果有第 9 個 key-value 落入當前的 bmap,那就需要再構建一個 bmap,通過 overflow 指針連接起來。
map創建方法:
我們實際上是通過調用的 makemap ,來創建map的。實際工作只是初始化了hmap中的各種欄位,如:設置B的大小, 設置hash 種子 hash 0.
注意 :
makemap 返回是*hmap 指針, 即 map 是引用對象, 對map的操作會影響到結構體內部 。
使用方式
對應的是下面兩種方法
map的key的類型,實現了自己的hash 方式。每種類型實現hash函數方式不一樣。
key 經過哈希計算後得到hash值,共 64 個 bit 位。 其中後B 個bit位置, 用來定位當前元素落在哪一個桶里, 高8個bit 為當前 hash 值的top hash。 實際上定位key的過程是一個雙重循環的過程, 外層循環遍歷 所有的overflow, 內層循環遍歷 當前bmap 中的 8個元素 。
舉例說明: 如果當前 B 的值為 5, 那麼buckets 的長度 為 2^5 = 32。假設有個key 經過hash函數計算後,得到的hash結果為:
外層遍歷bucket 中的鏈表
內層循環遍歷 bmap中的8個 cell
建議先不看此部分內容,看完後續 修改 map中元素 – 擴容 操作後 再回頭看此部分內容。
擴容前的數據:
等量擴容後的數據:
等量擴容後,查找方式和原本相同, 不多做贅述。
兩倍擴容後的數據
兩倍擴容後,oldbuckets 的元素,可能被分配成了兩部分。查找順序如下:
此處只分析 mapaccess1 ,。 mapaccess2 相比 mapaccess1 多添加了是否找到的bool值, 有興趣可自行看一下。
使用方式:
步驟如下:
擴容條件 :
擴容的標識 : h.oldbuckets != nil
假設當前定位到了新的buckets的3號桶中,首先會判斷oldbuckets中的對應的桶有沒有被搬遷過。 如果搬遷過了,不需要看原來的桶了,直接遍歷新的buckets的3號桶。
擴容前:
等量擴容結果
雙倍擴容會將old buckets上的元素分配到x, y兩個部key 1 B == 0 分配到x部分,key 1 B == 1 分配到y部分
注意: 當前只對雙倍擴容描述, 等量擴容只是重新填充了一下元素, 相對位置沒有改變。
假設當前map 的B == 5,原本元素經過hash函數計算的 hash 值為:
因為雙倍擴容之後 B = B + 1,此時B == 6。key 1 B == 1, 即 當前元素rehash到高位,新buckets中 y 部分. 否則 key 1 B == 0 則rehash到低位,即x 部分。
使用方式:
可以看到,每一遍歷生成迭代器的時候,會隨機選取一個bucket 以及 一個cell開始。 從前往後遍歷,再次遍歷到起始位置時,遍歷完成。
Golang 網路編程絲綢之路 – TCP/UDP 地址解析
TL;DR 在使用 Golang 編寫 TCP/UDP socket 的時候,第一步做的就是地址解析。
該函數返回的地址包含的信息如下:
TCPAddr 里, IP 既可以是 IPv4 地址,也可以是 IPv6 地址。 Port 就是埠了。 Zone 是 IPv6 本地地址所在的區域。
從返回結果看該函數的參數, network 指 address 的網路類型; address 指要解析的地址,會從中解析出我們想要的 IP , Port 和 Zone 。
從源碼中可以看出,參數 network 只能是如下四個值,否則會得到一個錯誤。
解析過程跟 ResolveTCPAddr 的一樣,不過得到的是 *UDPAddr 。
UDPAddr 包含的信息如下:
Golang database/sql源碼分析
Gorm是Go語言開發用的比較多的一個ORM。它的功能比較全:
但是這篇文章中並不會直接看Gorm的源碼,我們會先從database/sql分析。原因是Gorm也是基於這個包來封裝的一些功能。所以只有先了解了database/sql包才能更加好的理解Gorm源碼。
database/sql 其實也是一個對於mysql驅動的上層封裝。」github.com/go-sql-driver/mysql」就是一個對於mysql的驅動,database/sql 就是在這個基礎上做的基本封裝包含連接池的使用
下面這個是最基本的增刪改查操作
操作分下面幾個步驟:
因為Gorm的連接池就是使用database/sql包中的連接池,所以這裡我們需要學習一下包里的連接池的源碼實現。其實所有連接池最重要的就是連接池對象、獲取函數、釋放函數下面來看一下database/sql中的連接池。
DB對象
獲取方法
釋放連接方法
連接池的實現有很多方法,在database/sql包中使用的是chan阻塞 使用map記錄等待列表,等到有連接釋放的時候再把連接傳入等待列表中的chan 不在阻塞返回連接。
之前我們看到的Redigo是使用一個chan 來阻塞,然後釋放的時候放入空閑列表,在往這一個chan中傳入struct{}{},讓程序繼續 獲取的時候再從空閑列表中獲取。並且使用的是鏈表的結構來存儲空閑列表。
database/sql 是對於mysql驅動的封裝,然而Gorm則是對於database/sql的再次封裝。讓我們可以更加簡單的實現對於mysql資料庫的操作。
golang unicode/utf8源碼分析
包 utf-8 實現的功能和常量用於文章utf8編碼,包含runes和utf8位元組序列的轉換功能.在unicode中,一個中文佔兩個位元組,utf-8中一個中文佔三個位元組,golang默認的編碼是utf-8編碼,因此默認一個中文佔三個位元組,但是golang中的字元串底層實際上是一個byte數組.
Output:
RuneSelf該值的位元組碼值為128,在判斷是否是常規的ascii碼是使用。hicb位元組碼值為191. FF 的對應的位元組碼為255。
計算字元串中的rune數量,原理:首先取出字元串的碼值,然後判斷是不是個小於128的,如果是小於則直接continue.rune個數++.
如果是個十六進位f1.的則是無效字元,直接continue.rune個數++,也就是說一個無效的字元也當成一個字長為1的rune.如果字元的碼值在first列表中的值和7按位的結果為其字長,比如上面示例中的 鋼 。其字長為三位,第一位的值為 233 .二進位形式為 11101001 ;與7按位與後的值為0.從acceptRanges中取出的結果為{locb, hicb}。也就是標識 ox80 到 0xbf 之間的值。而結果n也就是直接size+3跳過3個位元組後,rune個數++。其他函數的處理流程差不多,不再過多敘述。
示例:
ValidString返回值表明參數字元串是否是一個合法的可utf8編碼的字元串。
RuneCount返回參數中包含的rune數量,第一個例子中將 utf8.RuneCountInString ,改成該方法調用,返回的結果相同。錯誤的和短的被當成一個長一位元組的rune.單個字元 H 就表示一個長度為1位元組的rune.
該函數標識參數是否以一個可編碼的rune開頭,上面的例子中,因為字元串是以一個ascii碼值在0-127內的字元開頭,所以在執行
first[p[0]] 時,取到的是 p[0] 是72,在first列表中,127之前的值都相同都為 0xF0 ,十進位標識為240,與7按位與後值為0,所以,直接返回 true .
和FullRune類似,只是參數為字元串形式
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/302908.html