「一文搞懂」ConcurrentHashMap实现原理及源码解析
liuian 2025-05-27 15:53 27 浏览
本章内容
简介
ConcurrentHashMap是Java并发包(JUC)中提供的一种线程安全的并发容器(即:HashMap的线程安全版本),主要用于高并发场景下key-value数据的存储。
实现原理
ConcurrentHashMap的实现原理在JDK的不同版本中存在很大的差异:
- 在JDK1.7版本中,ConcurrentHashMap通过数组+Segment分段锁+链表的方式实现,通过Segment分段锁(Segment继承了ReentrantLock)来保证并发场景下多线程操作的并发安全性。
- 在JDK1.8版本中,ConcurrentHashMap通过数组+链表+红黑树的方式实现,通过CAS+synchronized来保证并发场景下多线程操作的并发安全性。
本文主要分享ConcurrentHashMap在JDK1.8版本中的实现原理。
整体结构
ConcurrentHashMap的整体结构,如图所示:
其中:
- 数组:Node类型的数组,数组中的每个元素相当于一个哈希桶:
- 如果不发生哈希冲突,则每个元素都存储在数组中。
- 如果发生哈希冲突,则每个元素存储的是链表的头节点或红黑树的根节点。
- 链表:Node类型的链表,当发生哈希冲突时,通过链地址法将具有相同哈希值的Node节点组成一个链表。
- 红黑树:当链表的长度大于8且数组的长度大于等于64时,将链表转换为红黑树进行存储。
重要属性
ConcurrentHashMap的重要属性及常量:
public class ConcurrentHashMap<K,V> extends AbstractMap<K,V>
implements ConcurrentMap<K,V>, Serializable {
// Node数组,用于存储ConcurrentHashMap中的数据
transient volatile Node<K,V>[] table;
// 扩容时产生的新的Node数组,其容量为table数组的2倍
private transient volatile Node<K,V>[] nextTable;
/**
* sizeCtl值:
* 0:表示数组未初始化,且数组的初始容量为16
* 正数:如果数组未初始化,则该值记录的是数组的初始容量;如果数组已经初始化,则该值记录的是数组的扩容阈值(数组初始容量*0.75)
* -1:表示数组正在进行初始化
* -N:表示数组正在进行扩容,参与扩容的线程数为N-1
*/
private transient volatile int sizeCtl;
// Node数组最大容量
private static final int MAXIMUM_CAPACITY = 1 << 30;
// Node数组默认容量
private static final int DEFAULT_CAPACITY = 16;
// 扩容因子
private static final float LOAD_FACTOR = 0.75f;
/**
* 链表转红黑树阀值:
* 如果链表长度大于达到阀值,但数组容量小于64,则进行数组扩容。
* 如果链表长度大于达到阀值,且数组容量大于等于64,则将链表转为红黑树。
*/
static final int TREEIFY_THRESHOLD = 8;
// 红黑树转链表阀值,如果红黑树中的节点个数达到阀值,则将红黑树转为链表。
static final int UNTREEIFY_THRESHOLD = 6;
// 链表转红黑树数组容量最小值
static final int MIN_TREEIFY_CAPACITY = 64;
}
重要结构
Node
Node节点主要用于封装key-value键值对,ConcurrentHashMap中的链表由多个相连的Node节点组成。
static class Node<K,V> implements Map.Entry<K,V> {
// key的hash值
final int hash;
// key键
final K key;
// value值
volatile V val;
// 指向下一个Node节点的指针
volatile Node<K,V> next;
...
}
ForwardingNode
ForwardingNode主要用于数组进行扩容时标识哈希桶对应的头节点,ForwardingNode中不保存key-value键值对,只保存扩容时产生的新的Node数组(nextTable)的引用。ForwardingNode中的hash值为MOVED(-1),它定义了一个find()方法,用于扩容时从nextTable中查找对应的Node节点。
TreeBin
当ConcurrentHashMap中的链表转为红黑树后,数组中保存的引用为TreeBin,TreeBin内部不保存key-value键值对,而是保存TreeNode的List和红黑树Root。
TreeNode
红黑树的节点,TreeNode继承了ConcurrentHashMap.Node。
构造函数
ConcurrentHashMap的构造函数:
// 无参构造函数
public ConcurrentHashMap() {}
// 带初始化容量的构造函数
public ConcurrentHashMap(int initialCapacity) {
if (initialCapacity < 0)
throw new IllegalArgumentException();
/**
* 如果数组的初始容量大于(最大容量/2),则初始化容量大小为最大容量。
* 否则初始化容量大小为大于(initialCapacity+initialCapacity/2+1)的最小2^n值。
* 假设initialCapacity为8,则大于(8+8/2+1)的最小2^n为16,即:cap = 16
*/
int cap = ((initialCapacity >= (MAXIMUM_CAPACITY >>> 1)) ?
MAXIMUM_CAPACITY :
tableSizeFor(initialCapacity + (initialCapacity >>> 1) + 1));
// 设置sizeCtl变量的值为数组的初始化容量
this.sizeCtl = cap;
}
// 带集合的构造函数
public ConcurrentHashMap(Map<? extends K, ? extends V> m) {
// 设置sizeCtl变量的值为数组的默认容量
this.sizeCtl = DEFAULT_CAPACITY;
// 将集合中所有的key-value键值对添加到ConcurrentHashMap中
putAll(m);
}
// 带初始化容量和负载因子的构造函数
public ConcurrentHashMap(int initialCapacity, float loadFactor) {
this(initialCapacity, loadFactor, 1);
}
// 带初始化容量、负载因子以及并发线程数的构造函数
public ConcurrentHashMap(int initialCapacity,
float loadFactor, int concurrencyLevel) {
if (!(loadFactor > 0.0f) || initialCapacity < 0 || concurrencyLevel <= 0)
throw new IllegalArgumentException();
// 如果初始容量小于并发线程数,则初始容量为并发线程数的大小
if (initialCapacity < concurrencyLevel)
initialCapacity = concurrencyLevel;
// 数组大小
long size = (long)(1.0 + (long)initialCapacity / loadFactor);
/**
* 如果数组大小大于等于最大容量,则初始化容量大小为最大容量。
* 否则初始化容量大小为大于size的最小2^n值。
*/
int cap = (size >= (long)MAXIMUM_CAPACITY) ?
MAXIMUM_CAPACITY : tableSizeFor((int)size);
// 设置sizeCtl变量的值为数组的初始化容量
this.sizeCtl = cap;
}
put方法
实现原理
ConcurrentHashMap通过ConcurrentHashMap#put方法向其中添加key-value键值对。
ConcurrentHashMap#put方法执行流程,如图所示:
处理流程:
- 1)向ConcurrentHashMap中添加key-value键值对,计算key对应的hash值,自旋遍历table数组并进行判断:
- 如果table数组还未初始化,则初始化table数组。
- 如果key的hash值对应的数组下标处不存在Node节点,则根据key的hash值、key、value等值创建Node节点,并将创建的Node节点通过CAS的方式设置到hash值对应的数组下标处,退出自旋。
- 如果key的hash值对应的数组下标处存在Node节点,且Node节点的hash值为-1(即:ForwardingNode),说明正在进行数组扩容,则当前线程协助数组扩容,直到数组扩容完成,继续自旋。
- 如果key的hash值对应的数组下标处存在Node节点,且Node节点的hash值不为-1(即:正常的Node节点),则锁定该下标对应的哈希槽,并根据哈希槽中头节点类型进行判断:
- 如果节点类型为Node,说明哈希槽存储的是链表,则遍历链表并进行判断:
- 如果存在与key的hash值及key值相等的节点,则根据onlyIfAbsent值进行判断:
- true:退出链表遍历。
- false:用传入的value替换旧value,退出链表遍历。
- 如果不存在与key的hash值及key值相等的节点,则根据key的hash值、key、value等值创建Node节点并追加到链表的末尾(尾插法),退出链表遍历。
- 如果节点类型为TreeBin,说明哈希槽存储的是红黑树,则遍历红黑树并进行判断:
- 如果存在与key的hash值及key值相等的节点,则根据onlyIfAbsent值进行判断:
- true:不做处理。
- false:用传入的value替换旧value。
- 如果不存在与key的hash值及key值相等的节点,则根据key的hash值、key、value等值创建TreeNode节点添加到红黑树中。
- 判断binCount的值是否为0:
- 0:表示添加失败,继续自旋。
- 非0:表示添加成功,链表中的节点数是否达到8个:
- 节点数达到8个:如果table数组大小达到64,则将链表转为红黑树;否则进行数组扩容。
- 旧value是否为空:
- 不为空,则返回旧value。
- 2)增加节点总数,并返回null。
源码解析
ConcurrentHashMap#put方法源码解析:
public V put(K key, V value) {
// 添加key-value键值对
return putVal(key, value, false);
}
/**
* 添加key-value键值对具体实现
*/
final V putVal(K key, V value, boolean onlyIfAbsent) {
// 如果key或者value为空,则抛出空指针异常
if (key == null || value == null) throw new NullPointerException();
// 计算key的hash值
int hash = spread(key.hashCode());
int binCount = 0;
// 自旋遍历table数组
for (Node<K,V>[] tab = table;;) {
Node<K,V> f; int n, i, fh;
// 如果table数组未初始化,则初始化table数组
if (tab == null || (n = tab.length) == 0)
tab = initTable();
// 如果根据key的hash值计算得到的数组下标(i)处不存在对应的Node节点,则根据key的hash值、key、value等值创建新的Node节点,并以CAS的方式将新创建的Node节点添加到数组对应的下标处
else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
// 通过CAS的方式在下标i处创建Node节点
if (casTabAt(tab, i, null,
new Node<K,V>(hash, key, value, null)))
break; // no lock when adding to empty bin
}
// 如果Node节点的hash值为MOVED(-1),说明正在进行数组扩容,则协助数组扩容,直到数组扩容完成
else if ((fh = f.hash) == MOVED)
// 协助数组扩容
tab = helpTransfer(tab, f);
else { // 此处表示根据key的hash值计算得到的数组下标(i)处已经存在对应的Node节点
V oldVal = null;
// 锁定该下标对应的哈希槽
synchronized (f) {
// 判断数组下标i处的Node节点是否被修改
if (tabAt(tab, i) == f) {
// f节点的hash值大于等于0,说明是正常的Node节点(非转移节点)
if (fh >= 0) {
// 链表中已遍历的节点数
binCount = 1;
// 遍历链表
for (Node<K,V> e = f;; ++binCount) {
K ek;
/**
* 如果存在与key的hash值及key值相等的节点,则根据onlyIfAbsent值进行判断:
* true:退出链表遍历,继续自旋。
* false:用传入的value替换旧value,退出链表遍历,继续自旋。
*/
if (e.hash == hash &&
((ek = e.key) == key ||
(ek != null && key.equals(ek)))) {
oldVal = e.val;
// onlyIfAbsent为false,则用传入的value替换旧value
if (!onlyIfAbsent)
e.val = value;
break;
}
Node<K,V> pred = e;
// 如果不存在与key的hash值及key值相等的节点,则根据key的hash值、key、value等值创建Node节点并追加到链表的末尾(尾插法)
if ((e = e.next) == null) {
pred.next = new Node<K,V>(hash, key,
value, null);
break;
}
}
}
// 如果根据key的hash值计算得到的数组下标(i)处存放的是红黑树,则根据key的hash值、key、value等值创建TreeNode节点并添加到红黑树中
else if (f instanceof TreeBin) {
Node<K,V> p;
binCount = 2;
if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
value)) != null) {
oldVal = p.val;
if (!onlyIfAbsent)
p.val = value;
}
}
}
}
// binCount不等于0,说明已经添加成功
if (binCount != 0) {
// 如果binCount大于等于8,则将链表转化为红黑树
if (binCount >= TREEIFY_THRESHOLD)
treeifyBin(tab, i);
if (oldVal != null)
return oldVal;
break;
}
}
}
addCount(1L, binCount);
return null;
}
table数组初始化
ConcurrentHashMap中的table数组采用懒加载方式进行初始化。调用ConcurrentHashMap#initTable方法进行table数组初始化时,首先通过自旋来保证初始化成功,然后通过CAS的方式将SizeCtl变量的值设置为-1(-1表示数组正在进行初始化)来保证同一时刻只有一个线程对数组进行初始化,CAS成功后,再次判断当前数组是否已经初始化完成,如果已经初始化完成,则不会再次初始化。通过自旋+CAS+双重检查等手段保证了数组初始化时的线程安全。
ConcurrentHashMap#initTable方法源码解析:
private final Node<K,V>[] initTable() {
Node<K,V>[] tab; int sc;
// 如果table数组未初始化,则自旋进行初始化
while ((tab = table) == null || tab.length == 0) {
// sizeCtl小于0,说明存在其他线程正在进行初始化,则让出CPU使用权
if ((sc = sizeCtl) < 0)
// 让出CPU使用权
Thread.yield(); // lost initialization race; just spin
// 通过CAS的方式将sizeCtl的值更新为-1(-1表示数组正在进行初始化)
else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
try {
// 双重检查,再次判断table数组是否初始化
if ((tab = table) == null || tab.length == 0) {
// table数组容量:如果sc大于0,则设置sc的值为table数组的初始容量,否则设置table数组的初始容量为默认值(16)
int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
// 创建Node类型的数组,并赋值给table变量
@SuppressWarnings("unchecked")
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
table = tab = nt;
// 设置sc的值为table数组初始容量的3/4(即:75%)
sc = n - (n >>> 2);
}
} finally {
// 将sc的值赋给sizeCtl变量,初始化完成
sizeCtl = sc;
}
break;
}
}
return tab;
}
根据key的hash值计算数组下标
根据key的hash值计算方法:
static final int spread(int h) {
// h ^ (h >>> 16):高位运算,即:key.hashCode()的高16位异或低16位
return (h ^ (h >>> 16)) & HASH_BITS;
}
其中,参数h为key调用hashCode()方法得到的值。
假设数组长度为16,数组下标计算过程,如图所示:
协助扩容
在put方法中,通过遍历table数组中的Node节点向ConcurrentHashMap中添加key-value键值对时,如果key的hash值对应的数组下标处的头节点为ForwardingNode节点(即:节点中的hash值为-1),说明正在进行数组扩容,则通过调用ConcurrentHashMap#helpTransfer方法协助数组扩容,直到数组扩容完成。
ConcurrentHashMap#helpTransfer方法源码解析:
final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {
Node<K,V>[] nextTab; int sc;
// 如果table数组不为空且Node节点类型为ForwardingNode节点,并且ForwardingNode节点的nextTable引用不为空,则协助数组扩容
if (tab != null && (f instanceof ForwardingNode) &&
(nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {
// 获取扩容标识
int rs = resizeStamp(tab.length);
// 自旋,其中sizeCtl<0表示正在进行数组扩容
while (nextTab == nextTable && table == tab &&
(sc = sizeCtl) < 0) {
/**
* 满足以下四个条件,则退出自旋(即:不执行扩容操作)
* 条件1:当前线程获取的扩容标识是否与通过sc计算出来的扩容标识一致,不一致则退出循环
* 条件2:默认第一个线程设置为sc==(rs<<16)+2,当第一个线程扩容结束sc的值-1,即:sc==(rs<<16)+1,表示扩容结束
* 条件3:当前协助扩容的线程数达到最大值
* 条件4:转移下标小于0,表示扩容完成
*/
if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
sc == rs + MAX_RESIZERS || transferIndex <= 0)
break;
// 通过CAS的方式将sizeCtl变量的值+1,更新成功则执行数据转移
if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {
// 执行数据转移
transfer(tab, nextTab);
break;
}
}
// 返回扩容后的数组
return nextTab;
}
return table;
}
get方法
实现原理
ConcurrentHashMap通过ConcurrentHashMap#get方法获取key对应的value值。
ConcurrentHashMap#get方法执行流程,如图所示:
处理流程:
- 根据key从ConcurrentHashMap中获取value值,计算key对应的hash值,根据table数组及hash值对应的数组下标处是否存在节点进行判断:
- 如果数组为空或者hash值对应的下标处不存在节点,则返回null。
- 如果数组不为空且hash值对应的下标处存在节点:
- 继续判断头节点的hash值以及key值是否与传入key的hash值以及key值相等:
- 相等,则返回头节点的value值。
- 头节点的hash值与传入key的hash值不相等且头节点的hash值小于0:
- 头节点的hash值为-1:从nextTable数组(扩容后的数组)中查询,并返回查询结果。
- 头节点的hash值为-2:从红黑树中查询,并返回查询结果。
- 头节点的hash值与传入key的hash值不相等且头节点的hash值大于等于0,则遍历key的hash值对应的数组下标处的链表:
- 存在与key值相等的节点,则返回节点的value值。
- 不存在与key值相等的节点,则返回null。
源码解析
ConcurrentHashMap#get方法源码解析:
public V get(Object key) {
Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
// 计算key的hash值
int h = spread(key.hashCode());
// table数组不为空且key的hash值对应的数组下标处存在节点
if ((tab = table) != null && (n = tab.length) > 0 &&
(e = tabAt(tab, (n - 1) & h)) != null) {
// 如果头节点的hash值与key的hash相等,则继续判断头节点的key值与传入的key值相等
if ((eh = e.hash) == h) {
// 如果头节点的key值与传入key值相等,则返回头节点的value值
if ((ek = e.key) == key || (ek != null && key.equals(ek)))
return e.val;
}
/**
* 如果key的hash值对应的数组下标处的头节点hash值小于0,说明正在进行数组扩容,则从nextTable数组(扩容后的数组)中查找key对应的value值
* 根据eh的值分两种情况:
* 1)-1:表示ForwardingNode,调用ForwardingNode中的find()方法
* 2)-2:表示TreeBin,调用TreeBin中的find()方法
*/
else if (eh < 0)
return (p = e.find(h, key)) != null ? p.val : null;
// 如果key的hash值对应的数组下标处的头节点的key与key不相等,则遍历链表查找key对应的value值
while ((e = e.next) != null) {
if (e.hash == h &&
((ek = e.key) == key || (ek != null && key.equals(ek))))
return e.val;
}
}
// 没有找到key对应的节点,则返回null
return null;
}
扩容机制
实现原理
当table数组中保存的数据越来越多,数组中的空位会越来越少,从而导致添加数据时hash冲突增加,最终导致数组中的链表越来越长,降低数据查询效率。
为了防止数组中的链表过长,提高数据查询效率,ConcurrentHashMap引入了扩容机制。扩容操作并不是在数组中没有空位时才进行,当数组中已使用的哈希槽位达到扩容因子设定的比例(默认:0.75)时,就会触发对数组进行扩容操作,扩容后的数组容量为table数组的2倍。
扩容操作通过ConcurrentHashMap#tryPresize方法实现,整体流程如图所示:
处理流程:
- 1)设置扩容后数组容量为table数组容量的2倍。
- 2)判断table数组是否初始化:
- 未初始化,则初始化table数组。
- 已初始化,则判断table数组已扩容或数组大小达到最大值:
- 是则不执行扩容操作。
- 否则执行扩容操作。
- 3)根据sizeCtl变量值进行判断:
- sizeCtl变量值小于0,说明其他线程正在进行数组扩容,则以CAS的方式将sizeCtl变量值+1,协助数组扩容。
- sizeCtl变量值大于等于0,说明当前数组为第一个参与数组扩容的线程。
- 4)开始数据转移,根据table数据容量及CPU核数设置当前线程负责转移的哈希槽。并根据哈希槽中节点的hash值判断:
- hash值大于等于0,则转移链表中的数据。
- hash值小于0,则转移红黑树中的数据。
- 5)根据节点hash值&数组扩容位的结果(二进制与操作的结果)进行判断:
- 如果与操作结果为0,则数据转移后在新数组中的位置保持不变。
- 如果与操作结果为1,则数据转移后在新数组中的位置保持为原来位置+table数组容量。
- 6)设置哈希槽点头节点为ForwardingNode(表示正在进行数组扩容)。
- 7)当前线程负责的哈希槽数据转移完成,判断table数组中的所有数据是否转移完成:
- 否,则通过CAS的方式将sizeCtl变量的值-1,当前线程是否为最后一个扩容线程:
- 否,退出扩容操作。
- 是,设置转移完成标志,下次循环执行table数组中的所有数据转移完成操作。
- 是,则清空nextTable数组,设置table数组为扩容后的数组,设置sizeCtl的值为table数组容量的0.75倍。
扩容时二进制与操作
假设扩容前table数组容量为16,扩容后nextTable数组容量为32。
转移过程如图所示:
图中,table数组容量与nextTable数组容量的区别是二进制值中将第5位的值设置为1,即:将table数组容量向左移动一位得到nextTable数组容量。其中:
- key1值的第5位为1,扩容后的值为扩容前的值+table数组容量(即:18)。
- key2值的第5位为0,扩容后的值保持不变(即:5)。
源码解析
ConcurrentHashMap#tryPresize方法源码解析:
private final void tryPresize(int size) {
// 设置变量c为扩容后的数组容量为table数组的2倍,最大不超过MAXIMUM_CAPACITY值
int c = (size >= (MAXIMUM_CAPACITY >>> 1)) ? MAXIMUM_CAPACITY :
tableSizeFor(size + (size >>> 1) + 1);
int sc;
// 如果sizeCtl的值大于等于0,则自旋
while ((sc = sizeCtl) >= 0) {
Node<K,V>[] tab = table; int n;
// 如果table数组未初始化,则初始化table数组
if (tab == null || (n = tab.length) == 0) {
// 设置n值为sizeCtl和变量c中的较大值
n = (sc > c) ? sc : c;
// 以CAS的方式设置sizeCtl的值为-1,表示正在进行数组初始化
if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
try {
if (table == tab) {
@SuppressWarnings("unchecked")
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
table = nt;
// 设置变量sc的值为table数组容量的75%
sc = n - (n >>> 2);
}
} finally {
// 将变量sc的值赋值给sizeCtl变量(即:sizeCtl的值为table数组容量的75%)
sizeCtl = sc;
}
}
}
// 如果数组已经扩容或者table数组的容量达到最大作,则退出自旋(即:不执行扩容操作)
else if (c <= sc || n >= MAXIMUM_CAPACITY)
break;
// 执行扩容操作
else if (tab == table) {
// 获取扩容标识
int rs = resizeStamp(n);
// 如果sizeCtl的值小于0,说明正在进行数组扩容,则协助数组扩容
if (sc < 0) {
Node<K,V>[] nt;
/**
* 满足以下四个条件,则退出自旋(即:不执行扩容操作)
* 条件1:当前线程获取的扩容标识是否与通过sc计算出来的扩容标识一致,不一致则退出循环
* 条件2:默认第一个线程设置为sc==(rs<<16)+2,当第一个线程扩容结束sc的值-1,即:sc==(rs<<16)+1,表示扩容结束
* 条件3:当前协助扩容的线程数达到最大值
* 条件4:转移下标小于0,表示扩容完成
*/
if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
transferIndex <= 0)
break;
// 通过CAS的方式将sizeCtl变量的值+1,更新成功则执行数据转移
if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
// 执行数据转移
transfer(tab, nt);
}
// 此处表示当前线程为第一个扩容线程,则nextTable数组传null(会在数据转移时新建一个容量为table数组2被的数组)
else if (U.compareAndSwapInt(this, SIZECTL, sc,
(rs << RESIZE_STAMP_SHIFT) + 2))
// 执行数据转移,注意:此处nextTable数组传null
transfer(tab, null);
}
}
}
// 执行数据转移方法
private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
int n = tab.length, stride;
/**
* stride变量表示每个线程进行数据转移时负责的哈希槽数
* 计算规则:
* 如果CPU核数大于1,则每个线程负责的哈希槽数为table数组容量/8
* 如果CPU核数等于1,则该线程负责整个table数组的所有哈希槽
* 每个消息负责的哈希槽数最少为16个
*/
if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
stride = MIN_TRANSFER_STRIDE; // subdivide range
// 如果传入的nextTable数组为空,则创建nextTable数组,容量为table数组的2倍
if (nextTab == null) { // initiating
try {
@SuppressWarnings("unchecked")
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
nextTab = nt;
} catch (Throwable ex) { // try to cope with OOME
sizeCtl = Integer.MAX_VALUE;
return;
}
nextTable = nextTab;
// 当前线程进行数据转移的哈希槽区间
transferIndex = n;
}
int nextn = nextTab.length;
// 创建ForwardingNode节点,并设置nextTable属性为nextTable数组的引用
ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
// 标识某个哈希槽中的数据是否完成转移,true-表示转移完成,开启下一个哈希槽转移
boolean advance = true;
// 标识table数组中的数据是否完成转移,true-表示转移完成
boolean finishing = false; // to ensure sweep before committing nextTab
// 开始转移某个哈希槽中的数据,i-表示当前需要转移的哈希槽,bound-表示需要转移的哈希槽边界
for (int i = 0, bound = 0;;) {
Node<K,V> f; int fh;
/**
* 根据哈希槽的转移情况设置变量i和bound
* i:transferIndex-1
* bound:transferIndex-stride
*/
while (advance) {
int nextIndex, nextBound;
if (--i >= bound || finishing)
advance = false;
else if ((nextIndex = transferIndex) <= 0) {
i = -1;
advance = false;
}
// 以CAS的方式设置transferIndex = transferIndex - stride
else if (U.compareAndSwapInt
(this, TRANSFERINDEX, nextIndex,
nextBound = (nextIndex > stride ?
nextIndex - stride : 0))) {
bound = nextBound;
i = nextIndex - 1;
advance = false;
}
}
// 当前线程负责的哈希槽数据转移完成
if (i < 0 || i >= n || i + n >= nextn) {
int sc;
// table数组的所有数据转移完成
if (finishing) {
// 清空nextTable数组
nextTable = null;
// 设置table数组为扩容后的数组
table = nextTab;
// 设置sizeCtl的值为table数组容量的0.75倍
sizeCtl = (n << 1) - (n >>> 1);
return;
}
// 通过CAS的方式将sizeCtl变量的值-1
if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
// 如果当前线程不是本次执行扩容操作的最后一个转移线程,则退出
if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
return;
finishing = advance = true;
i = n; // recheck before commit
}
}
// 如果当前哈希槽中不存在节点,则设置哈希槽的头节点为ForwardingNode节点
else if ((f = tabAt(tab, i)) == null)
advance = casTabAt(tab, i, null, fwd);
// 如果当前哈希槽中的数据已经转移完成,则设置advance为true
else if ((fh = f.hash) == MOVED)
advance = true; // already processed
// 当前哈希槽中的数据未转移完成,则继续转移数据
else {
// 锁定当前哈希槽
synchronized (f) {
if (tabAt(tab, i) == f) {
Node<K,V> ln, hn;
// 节点的hash值大于0,说明转移的事链表中的数据
if (fh >= 0) {
int runBit = fh & n;
Node<K,V> lastRun = f;
for (Node<K,V> p = f.next; p != null; p = p.next) {
int b = p.hash & n;
if (b != runBit) {
runBit = b;
lastRun = p;
}
}
if (runBit == 0) {
ln = lastRun;
hn = null;
}
else {
hn = lastRun;
ln = null;
}
for (Node<K,V> p = f; p != lastRun; p = p.next) {
int ph = p.hash; K pk = p.key; V pv = p.val;
// 根据节点的哈希值与n的结果是否为0将链表拆分为两个子链表
if ((ph & n) == 0)
ln = new Node<K,V>(ph, pk, pv, ln);
else
hn = new Node<K,V>(ph, pk, pv, hn);
}
// (ph & n)==0,将链表中的节点设置到ln链表中,ln链表保存转移后在新数组中位置保持不变的节点
setTabAt(nextTab, i, ln);
// (ph & n)!=0,将链表中的节点设置到hn链表中,hn链表保存转移后在新数组中位置为i+n的节点
setTabAt(nextTab, i + n, hn);
// 设置哈希槽点头节点为ForwardingNode
setTabAt(tab, i, fwd);
advance = true;
}
// 转移红黑树中的数据
else if (f instanceof TreeBin) {
TreeBin<K,V> t = (TreeBin<K,V>)f;
TreeNode<K,V> lo = null, loTail = null;
TreeNode<K,V> hi = null, hiTail = null;
int lc = 0, hc = 0;
for (Node<K,V> e = t.first; e != null; e = e.next) {
int h = e.hash;
TreeNode<K,V> p = new TreeNode<K,V>
(h, e.key, e.val, null, null);
if ((h & n) == 0) {
if ((p.prev = loTail) == null)
lo = p;
else
loTail.next = p;
loTail = p;
++lc;
}
else {
if ((p.prev = hiTail) == null)
hi = p;
else
hiTail.next = p;
hiTail = p;
++hc;
}
}
ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
(hc != 0) ? new TreeBin<K,V>(lo) : t;
hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
(lc != 0) ? new TreeBin<K,V>(hi) : t;
setTabAt(nextTab, i, ln);
setTabAt(nextTab, i + n, hn);
setTabAt(tab, i, fwd);
advance = true;
}
}
}
}
}
}
常见问题
为什么数组大小必须为2的n次方?
将数组设置为2的n次方主要为了减少哈希碰撞的概率。
假设向ConcurrentHashMap中添加key为16、17、18三个key-value键值对,16、17、18三个key的二进制值为10000、10001、10010:
- 如果数组大小不是2的n次方,如:数组大小为21,那么数组大小-1为20,其二进制值为10100,分别与16、17、18的二进制值进行&运算后的结果都是10000。
- 如果数组大小是2的n次方,如:数组大小为2^4,那么数组大小-1为15,其二进制值为1111,分别与16、17、18的二进制值进行&运算后的结果为0000、0001、0010。
通过对比,将数组设置为2的n次方显然减少了哈希碰撞的概率。
为什么查询数组下标时使用按位与(&)操作?
使用按位与操作的原因是按位与操作更高效。如:数组扩容时通过按位与进行数据迁移。
使用示例
/**
* @author 南秋同学
* ConcurrentHashMap使用示例
*/
@Slf4j
public class ConcurrentHashMapExample {
private static ConcurrentHashMap<String, AtomicInteger> count = new ConcurrentHashMap();
private static CountDownLatch countDownLatch = new CountDownLatch(3);
public static void main(String[] args) {
Runnable task = new Runnable() {
@Override
public void run() {
AtomicInteger old;
for (int i = 0; i < 10; i++) {
old = count.get("南秋同学");
if (null == old) {
AtomicInteger zero = new AtomicInteger(0);
old = count.putIfAbsent("南秋同学", zero);
if (null == old) {
old = zero;
}
}
old.incrementAndGet();
}
countDownLatch.countDown();
}
};
new Thread(task).start();
new Thread(task).start();
new Thread(task).start();
try {
countDownLatch.await();
log.info("count:{}",count);
} catch (Exception e) {
e.printStackTrace();
}
}
}
相关推荐
- 总结下SpringData JPA 的常用语法
-
SpringDataJPA常用有两种写法,一个是用Jpa自带方法进行CRUD,适合简单查询场景、例如查询全部数据、根据某个字段查询,根据某字段排序等等。另一种是使用注解方式,@Query、@Modi...
- 解决JPA在多线程中事务无法生效的问题
-
在使用SpringBoot2.x和JPA的过程中,如果在多线程环境下发现查询方法(如@Query或findAll)以及事务(如@Transactional)无法生效,通常是由于S...
- PostgreSQL系列(一):数据类型和基本类型转换
-
自从厂子里出来后,数据库的主力就从Oracle变成MySQL了。有一说一哈,贵确实是有贵的道理,不是开源能比的。后面的工作里面基本上就是主MySQL,辅MongoDB、ES等NoSQL。最近想写一点跟...
- 基于MCP实现text2sql
-
目的:基于MCP实现text2sql能力参考:https://blog.csdn.net/hacker_Lees/article/details/146426392服务端#选用开源的MySQLMCP...
- ORACLE 错误代码及解决办法
-
ORA-00001:违反唯一约束条件(.)错误说明:当在唯一索引所对应的列上键入重复值时,会触发此异常。ORA-00017:请求会话以设置跟踪事件ORA-00018:超出最大会话数ORA-00...
- 从 SQLite 到 DuckDB:查询快 5 倍,存储减少 80%
-
作者丨Trace译者丨明知山策划丨李冬梅Trace从一开始就使用SQLite将所有数据存储在用户设备上。这是一个非常不错的选择——SQLite高度可靠,并且多种编程语言都提供了广泛支持...
- 010:通过 MCP PostgreSQL 安全访问数据
-
项目简介提供对PostgreSQL数据库的只读访问功能。该服务器允许大型语言模型(LLMs)检查数据库的模式结构,并执行只读查询操作。核心功能提供对PostgreSQL数据库的只读访问允许L...
- 发现了一个好用且免费的SQL数据库工具(DBeaver)
-
缘起最近Ai不是大火么,想着自己也弄一些开源的框架来捣腾一下。手上用着Mac,但Mac都没有显卡的,对于学习Ai训练模型不方便,所以最近新购入了一台4090的拯救者,打算用来好好学习一下Ai(呸,以上...
- 微软发布.NET 10首个预览版:JIT编译器再进化、跨平台开发更流畅
-
IT之家2月26日消息,微软.NET团队昨日(2月25日)发布博文,宣布推出.NET10首个预览版更新,重点改进.NETRuntime、SDK、libraries、C#、AS...
- 数据库管理工具Navicat Premium最新版发布啦
-
管理多个数据库要么需要使用多个客户端应用程序,要么找到一个可以容纳你使用的所有数据库的应用程序。其中一个工具是NavicatPremium。它不仅支持大多数主要的数据库管理系统(DBMS),而且它...
- 50+AI新品齐发,微软Build放大招:拥抱Agent胜算几何?
-
北京时间5月20日凌晨,如果你打开微软Build2025开发者大会的直播,最先吸引你的可能不是一场原本属于AI和开发者的技术盛会,而是开场不久后的尴尬一幕:一边是几位微软员工在台下大...
- 揭秘:一条SQL语句的执行过程是怎么样的?
-
数据库系统能够接受SQL语句,并返回数据查询的结果,或者对数据库中的数据进行修改,可以说几乎每个程序员都使用过它。而MySQL又是目前使用最广泛的数据库。所以,解析一下MySQL编译并执行...
- 各家sql工具,都闹过哪些乐子?
-
相信这些sql工具,大家都不陌生吧,它们在业内绝对算得上第一梯队的产品了,但是你知道,他们都闹过什么乐子吗?首先登场的是Navicat,这款强大的数据库管理工具,曾经让一位程序员朋友“火”了一把。Na...
- 详解PG数据库管理工具--pgadmin工具、安装部署及相关功能
-
概述今天主要介绍一下PG数据库管理工具--pgadmin,一起来看看吧~一、介绍pgAdmin4是一款为PostgreSQL设计的可靠和全面的数据库设计和管理软件,它允许连接到特定的数据库,创建表和...
- Enpass for Mac(跨平台密码管理软件)
-
还在寻找密码管理软件吗?密码管理软件有很多,但是综合素质相当优秀且完全免费的密码管理软件却并不常见,EnpassMac版是一款免费跨平台密码管理软件,可以通过这款软件高效安全的保护密码文件,而且可以...
- 一周热门
-
-
Python实现人事自动打卡,再也不会被批评
-
【验证码逆向专栏】vaptcha 手势验证码逆向分析
-
Psutil + Flask + Pyecharts + Bootstrap 开发动态可视化系统监控
-
一个解决支持HTML/CSS/JS网页转PDF(高质量)的终极解决方案
-
再见Swagger UI 国人开源了一款超好用的 API 文档生成框架,真香
-
网页转成pdf文件的经验分享 网页转成pdf文件的经验分享怎么弄
-
C++ std::vector 简介
-
飞牛OS入门安装遇到问题,如何解决?
-
系统C盘清理:微信PC端文件清理,扩大C盘可用空间步骤
-
10款高性能NAS丨双十一必看,轻松搞定虚拟机、Docker、软路由
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)