1.Java集合类继承关系图

2.HashMap和HashTable

2.1解决Hash冲突的三种方式

开放寻址法：所有的元素都存放在哈希表中，如果存在冲突就通过再寻址的方法（探查序列），寻找下一处地址，直到找到空的地址为止。
- 某大佬通俗点说：如果你想上厕所，但是拉开厕所门之后发现有位同学正在使劲，那怎么办？你会很自然的拉下一间门，直到找到空的位置为止。一般来说，你不会按照顺序一个一个地拉厕所门，而是会去拉你认为有可能没有被占用的单间的门，这可以通过闻味道，听声音来辨别，这就是寻址查找算法。如果找遍了厕所还是没有位置怎么办？这就需要扩容，至于什么时候扩容怎么扩容具体问题具体分析，还会涉及负载因子等术语。
拉链法：相同Hash值的元素，存入相同位置的链表中。
再哈希法：发生冲突之后，再次哈希。

2.2HashMap

HashMap在1.8的时候做了一个很大的改动，底层实现由数组中存放Entry<K, V>(实现了Map.Entry<K, V>)节点 + 链表变成了数组中存放Node<K, V>(实现了Map.Entry<K, V>)节点 + 链表 + 红黑树。
HashMap初始长度是16，一倍扩容，到达阈值0.75触发扩容。在指定大小创建时，HashMap会自动扩容到2的指数次。当数组长度超过64，链表长度超过8，才会把底层的链表变成红黑树，小于6变回链表。
JDK1.7中HashMap扩容Resize的时候，链表采用的头插法。导致在多线程的环境下，会出现闭环。JDK1.8的时候对这点做了优化，采用的是尾插法，但是HashMap在多线程下依旧是不安全的。

1.如图所示HashMap，存在两个key，1和3，假设再增加一个元素会触发扩容

2.此时线程1和线程2都执行put()操作，都触发扩容，并且线程1执行transfer()中的Entry<K,V> next = e.next后被挂起，此时e指向1，next指向3

3.线程2开始执行，并且在新的数组中1和3还会发生哈希冲突，由于使用的是头插法那么线程2完成扩容后最终数组如图

4.回到线程1，e指向1，next指向3，当执行到e.next = newTable[i]，便会出现循环链表

5.之后我们通过get(1)和get(3)不会出现问题，但是get(5)，就会一直在链表中向下寻找，由于链表闭环，导致死循环。

具体详情参考：HashMap头插法为什么会出现死循环

	//jdk1.7 HashMap
	void resize(int newCapacity) {
        Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
        if (oldCapacity == MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return;
        }

        Entry[] newTable = new Entry[newCapacity];
        transfer(newTable, initHashSeedAsNeeded(newCapacity));
        table = newTable;
        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
    }

    /**
     * Transfers all entries from current table to newTable.
     */
    void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {
            while(null != e) {
                Entry<K,V> next = e.next;//这行代码是导致问题的关键代码。
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            }
        }
    }

	//jdk1.8 HashMap
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null) //如果多线程a，b在这里执行后切换，就会导致数据覆盖
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

2.3HashTable

如果存储null值和null键，可以通过编译期，但是运行会报NPE异常。
是线程安全的。

public synchronized V put(K key, V value) {
        // Make sure the value is not null
        if (value == null) {
            throw new NullPointerException();
        }

        // Makes sure the key is not already in the hashtable.
        Entry<?,?> tab[] = table;
        int hash = key.hashCode(); //这里如果key是null，报错NPE
        int index = (hash & 0x7FFFFFFF) % tab.length;
        @SuppressWarnings("unchecked")
        Entry<K,V> entry = (Entry<K,V>)tab[index];
        for(; entry != null ; entry = entry.next) {
            if ((entry.hash == hash) && entry.key.equals(key)) {
                V old = entry.value;
                entry.value = value;
                return old;
            }
        }

        addEntry(hash, key, value, index);
        return null;
    }

3.HashMap源码注释翻译

Java的开发者对HashMap有详细的说明解释，而这段解释就在HashMap类的注释上，这里简单做一些翻译，希望可以帮到你。

HashTable实现了Map接口类， HashMap这些接口实现了所有可选的map功能，包括允许空值和空key。(HashMap和HashTable基本一致，区别是HashMap是线程不安全（不同步）的且允许空key。 HashMap不保证map的顺序，而且顺序是可变的。)

如果将数据适当的分散到桶里， HashMap的添加、查询函数的执行周期是常量值,使用迭代器遍历所有数据的性能跟HashMap的桶（bucket）数量有直接关系，为了提高遍历的性能，不能设置比较大的桶数量或者负载因子过低。

HashMap实例有2个重要参数影响它的性能：初始容量和负载因子。初始容量是指在哈希表里的桶总数，一般在创建HashMap实例时设置初始容量。负载因子是指哈希表在多满时扩容的百分比比例。当哈希表的数据个数超过负载因子和当前容量的乘积时，哈希表要再做一次哈希（重建内部数据结构），哈希表每次扩容为原来的2倍。

负载因子的默认值是0.75，它平衡了时间和空间复杂度。负载因子越大会降低空间使用率，但提高了查询性能（表现在哈希表的大多数操作是读取和查询）考虑哈希表的性能问题，要设置合适的初始容量，从而减少rehash的次数。当哈希表中entry的总数少于负载因子和初始容量乘积时，就不会发生rehash动作。

如果有很多值要存储到HashMap实例中，在创建HashMap实例时要设置足够大的初始容量，避免自动扩容时rehash。 如果很多关键字的哈希值相同，会降低哈希表的性能。为了降低这个影响，当关键字支持java.lang.Comparable时，可以对关键字做次排序以降低影响。

哈希表是非线程安全的，如果多线程同时访问哈希表，且至少一个线程修改了哈希表的结构，那么必须在访问hashmap前设置同步锁。（修改结构是指添加或者删除一个或多个entry，修改键值不算是修改结构。）一般在多线程操作哈希表时，要使用同步对象封装map。

如果不封装Hashmap，可以使用Collections.synchronizedMap 方法调用HashMap实例。在创建HashMap实例时避免其他线程操作该实例，即保证了线程安全。

    /**
     * The smallest table capacity for which bins may be treeified.
     * (Otherwise the table is resized if too many nodes in a bin.)
     * Should be at least 4 * TREEIFY_THRESHOLD to avoid conflicts
     * between resizing and treeification thresholds.
     */
    static final int MIN_TREEIFY_CAPACITY = 64;

最小树形化容量阈值，即哈希表容量 > 64 才允许链表转换为红黑树，否则，若桶内的元素太多，则直接扩容，而不进行树形化。为了避免进行扩容和树形化冲突，这个值不能小于4 * 8

4.ArrayList、LinkedList和Vector的区别

4.1ArrayList和LinkedList区别

是否保证线程安全：二者都是线程不安全的
底层结构：
- ArrayList底层是Object数组，初始创建的时候是空数组，只有在第一次添加数据的时候才会扩容至10，以后1.5被扩容，即15，22。底层是先**Arrays.copyOf()**原数组，再进行add操作
- LinkedList底层是双向链表
时间复杂度：
- ArrayList在执行add()方法的时候其实是数组复制的过程，默认是向末尾添加一个元素，时间复杂度是O(1)，但是指定位置的时候，复杂度就是O(n-1)
- LinkedList添加元素的时候是解开链表前后关系插入元素，时间复杂度近似于O(1)
- 所以ArrayList在随机访问上速度快于LinkedList，但是在频繁新增删除的时候，LinkedList明显优于ArrayList
内存空间占用：
- ArrayList的空间浪费主要是由于扩容机制导致，末尾会存留一部分剩余空间。
- LinkedList的空间浪费主要是需要保存前后指针。

4.2ArrayList和Vector区别

Vector类的所有方法都是同步的，是线程安全的，但是如果只有一个线程，会耗费大量的时间。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Java集合.md

Java集合.md

1.Java集合类继承关系图

2.HashMap和HashTable

2.1解决Hash冲突的三种方式

2.2HashMap

2.3HashTable

3.HashMap源码注释翻译

4.ArrayList、LinkedList和Vector的区别

4.1ArrayList和LinkedList区别

4.2ArrayList和Vector区别

Files

Java集合.md

Latest commit

History

Java集合.md

File metadata and controls

1.Java集合类继承关系图

2.HashMap和HashTable

2.1解决Hash冲突的三种方式

2.2HashMap

2.3HashTable

3.HashMap源码注释翻译

4.ArrayList、LinkedList和Vector的区别

4.1ArrayList和LinkedList区别

4.2ArrayList和Vector区别