HashMap是Java中最常見、最重要的數據結構之一,其底層原理也是Java程序員必須熟悉的內容。本篇文章將從多個方面對HashMap進行詳細講解,包括其基本結構、底層實現機制、性能調優以及常見問題等。
一、基本結構
HashMap是一個散列表,它存儲的內容是鍵值對(key-value),這些鍵值對又被封裝成了一個個的Entry對象。HashMap的內部結構是一個數組,每個元素對應着一個Entry對象的鏈表,HashMap通過哈希算法得到一個鍵值對應的索引位置,將其插入到該位置對應的Entry鏈表中。當出現衝突時,HashMap採用鏈表法來解決衝突。
例如,我們向HashMap插入一個鍵值對(key1,value1),HashMap先通過哈希算法得到key1的索引位置index,如果此位置沒有元素,直接將key1-value1插入該位置;如果該位置已有元素,說明發生了衝突,將key1-value1插入該位置上Entry的鏈表尾部。
HashMap的基本操作包括put、get、remove和containsKey,其中put用於添加新的鍵值對,get用於獲取對應鍵的值,remove用於刪除對應的鍵值對,containsKey用於檢測某個鍵是否已經存在於HashMap中。
二、底層實現機制
HashMap基於數組和鏈表實現,其基本數據結構為Entry數組,Entry定義如下:
“`
static class Entry implements Map.Entry {
final K key;
V value;
Entry next;
int hash;
…
}
“`
Entry是一個靜態內部類,由鍵值對(key-value)和指向下一個Entry的指針(next)組成。由於java中的數組和泛型不能很好的結合,因此數組元素類型為Entry,而不是鍵值對類型。
HashMap定義了一個初始容量(initialCapacity)和裝載因子(loadFactor)兩個參數,當HashMap中元素個數(size)超過(initialCapacity * loadFactor)時,會進行擴容。HashMap的默認初始容量為16,裝載因子為0.75。當HashMap達到size閾值時,HashMap會將容量變為原來的2倍,並將已有元素重新分配到新容量的位置上。
HashMap的哈希算法是將key通過其hashCode()方法生成hash值,再將hash值通過特定的算法轉換為實際的數組索引值。這個算法的關鍵在於如何將hash值轉換為索引值,如果不合理,容易出現哈希衝突,從而影響HashMap的性能。HashMap中默認的算法相對比較簡單,通過計算(key的hashCode() ^ (key的hashCode() >>> 16)) & (n-1)得到數組索引值,其中n為HashMap的容量。
當多個鍵通過哈希算法得到的索引值相同時,HashMap使用鏈表法來解決衝突。即將被附加到該位置的鍵值對添加到該位置上Entry鏈表的尾部。但是,隨着鏈表長度的增加,查詢時間會大大增加,HashCollision導致的過長鏈表稱為“鏈表陷阱”(LinkedTrap),這會極大的影響HashMap的性能。為了解決這一問題,JDK1.8引入了紅黑樹機制,當鏈表長度太長時,將鏈錶轉換為紅黑樹,從而有效地提高了HashMap的性能。
三、性能調優
HashMap的性能調優需要注意以下幾點:
1、初始化容量和裝載因子
初始化容量和裝載因子直接影響性能。初始容量過小,將導致頻繁的擴容操作,而初始容量過大,則會導致浪費內存空間。裝載因子過小將導致HashMap中大量的內存空間未被使用,存在浪費;而裝載因子過大將導致哈希衝突,影響HashMap的性能。在實際使用中,通常初始化容量為2的n次方,裝載因子為0.75。
2、謹慎使用HashMap作為緩存
放置過多的對象到HashMap中是會導致內存泄露的,而由於HashCollision而出現鏈表陷阱,則會降低性能。因此,謹慎使用HashMap作為緩存時應該注意其域內存泄露問題、並發線程安全問題以及性能問題。
3、使用JDK1.8中的紅黑樹
在高並發和HashCollision的情況下,鏈表很容易出現鏈表陷阱,查詢性能下降。JDK1.8中引入了紅黑樹機制,當鏈表長度過長時,將鏈錶轉換為紅黑樹,通過樹的方式快速查找對應元素,提高了HashMap的性能。在使用時,應當注意HashMap的元素數量,避免過長的鏈表陷阱。
四、常見問題
1、HashMap中的鍵為什麼需要重寫hashCode()和equals()方法?
因為HashMap的哈希算法是通過計算key的hashCode()值得到的,如果同一key的hashCode()值發生變化,則可能會導致key未被放在正確的位置上。同時,hashCode()和equals()方法也影響着HashMap中鍵值對的查找,如果沒有正確地重寫hashCode()和equals()方法,將導致查找結果不正確,HashMap的使用將會出現錯誤。
2、什麼情況下不應該使用HashMap?
當需要緩存大量對象時,使用Hash Collision機制可能會佔用大量的內存空間,導致頻繁的GC,應當考慮使用LRU Cache等其他緩存方式。此外,使用HashMap時,需要注意其域內存泄露問題、並發線程安全問題以及性能問題。
五、完整示例代碼
“`
public class HashMapDemo {
public static void main(String[] args) {
Map hashMap = new HashMap(16, 0.75f);
hashMap.put(“key1”, “value1”);
hashMap.put(“key2”, “value2”);
hashMap.put(“key3”, “value3”);
hashMap.put(“key4”, “value4”);
hashMap.put(“key5”, “value5”);
hashMap.put(“key6”, “value6”);
hashMap.put(“key6”, “value7”);
hashMap.remove(“key5”);
for (Map.Entry entry : hashMap.entrySet()) {
System.out.println(entry.getKey() + “:” + entry.getValue());
}
}
}
“`
以上是一個簡單的HashMap示例,將多個鍵值對添加到HashMap中,並輸出結果。在實際代碼中,我們需要仔細考慮初始化容量和裝載因子、重寫hashCode()和equals()方法以及使用JDK1.8中的紅黑樹等問題,以確保HashMap的性能和正確性。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/245008.html