HashMap进行put操作会引起死循环?
最近在磕《java并发编程艺术》,在看到第六章的时候出现了下面这段我不是很理解的东西,如下
《java并发编程艺术》截取
为什么要使用ConcurrentHashMap
在并发编程中使用HashMap可能导致程序死循环。而使用线程安全的HashTable效率又非常低下,基于以上两个原因,便有了ConcurrentHashMap的登场机会。
1. 线程不安全的HashMap
在多线程环境下,使用HashMap进行put操作会引起死循环,导致CPU利用率接近100%,所以在并发情况下不能使用HashMap。例如,执行以下代码会引起死循环。
final HashMap<String, String> map = new HashMap<> (2); Thread t = new Thread (() -> { for (int i = 0; i < 10000; i++) { new Thread (() -> map.put (UUID.randomUUID ().toString (), ""), "ftf" + i).start (); } }, "ftf"); t.start(); t.join();
HashMap在并发执行put操作时会引起死循环,是因为多线程会导致HashMap的Entry链表形成环形数据结构,一旦形成环形数据结构,Entry的next节点永远不为空,就会产生死循环获取Entry。
不知道是不是由于篇幅原因,我觉得作者并没有把为什么会引起死循环说明白,我只好自己再去看源码了
JDK1.8 HashMap源码
HashMap中关于put操作的源码如下
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal (int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K, V>[] tab;
Node<K, V> p;
int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize ()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode (hash, key, value, null);
else {
Node<K, V> e;
K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals (k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K, V>) p).putTreeVal (this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++ binCount) {
//e是p的下一个节点
if ((e = p.next) == null) {
//插入链表的尾部
p.next = newNode (hash, key, value, null);
//如果插入后链表长度大于8则转化为红黑树
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin (tab, hash);
break;
}
//如果key在链表中已经存在,则退出循环
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals (k))))
break;
p = e;
}
//如果key在链表中已经存在,则修改其原先的key值,并且返回老的值
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (! onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess (e);
return oldValue;
}
}
++ modCount;
if (++ size > threshold)
resize ();
afterNodeInsertion (evict);
return null;
}
当你看到这的时候是不是还是不懂为什么会有死循环?是的,我看到这也没懂,只能去网上看看大佬们怎么说
百度上关于这个问题的第一篇文章就是这个:https://www.cnblogs.com/wfq9330/p/9023892.html
这源码跟我看的JDK1.8的截然不同,目测应该是JDK1.8以下的
结论
- JDK1.8之前,为了提高rehash的速度,冲突链表是使用头插法,因为头插法是操作速度最快的,找到数组位置就直接找到插入位置了,头插法在多线程下回引起死循环
- JDK1.8之后开始加入红黑树,当链表长度大于8时链表就会转换成红黑树,这样就大大提高了在冲突链表查找的速度,同时因为链表的长度不可能大于8,链表在rehash的消耗就小很多,所以JDK1.8使用尾插法也避免了死循环问题