当前位置：首页 > news >正文

Java集合(Collection List Set Map)

news 来源：原创 2024/11/1 16:18:50

文章目录

- Collection接口和常用方法
- - - Collection接口遍历元素方式1 -使用Iterator(迭代器)
    - Collection接口遍历对象方式2-for循环增强
- List接口和常用方法
- - - List[ArrayList, LinkedList, Vector]的三种遍历方式
    - ArrayList的注意事项
    - ArrayList的底层操作机制源码分析
    - Vector和ArrayList的比较
    - LinkedList底层结构
    - LinkedList的底层操作机制
    - ArrayList和LinkedList的比较
- Set接口和常用方法
- - - HashSet的全面说明
    - HashSet底层机制说明
    - HashSet的扩容和转成红黑树机制
    - Set接口实现类 - LinkedHashSet
- Map接口和常用方法
- - - 常用方法
    - Map遍历方式
    - HashMap小结
    - HashMap底层机制
    - Map接口实现类 -HashTable的基本介绍
    - Map接口实现类 - Properties基本介绍
- 总结-开发中如何选择集合实现类
- Collections工具类

集合的理解和好处

前面我们保存多个数据使用的是数组，那么数组有不足的地方，我们分析一下。

1)长度开始时必须指定，而且一旦指定，不能更改
2)保存的必须为同一类型的元素
3)使用数组进行增加元素的示意代码-比较麻烦

那么集合有哪些好处呢?

1)可以动态保存任意多个对象，使用比较方便!
2)提供了一系列方便的操作对象的方法: add、 remove、 set、 get等
3)使用集合添加, 删除新元素的示意代码-简洁了

Collection接口和常用方法

public interface Collection<E> extends Iterable<E>

1)collection实现子类可以存放多个元素，每个元素可以是Object
2)有些Collection的实现类，可以存放重复的元素，有些不可以
3)有些Collection的实现类，有些是有序的(List)，有些不是有序(Set)
4)Collection接口没有直接的实现子类，是通过它的子接口Set和List来实现的

Collection接口常用方法,以实现子类ArrayList来演示

add:添加单个元素
remove:删除指定元素
contains:查找元素是否存在
size:获取元素个数
isEmpty:判断是否为空
clear:清空
addAll:添加多个元素
containsAll:查找多个元素是否都存在
removeAll:删除多个元素

Collection接口遍历元素方式1 -使用Iterator(迭代器)

Iterator对象称为迭代器，主要用于遍历Collection集合中的元素。
所有实现了Collection接口的集合类都有一个iterator(方法，用以返回一个实现了Iterator接口的对象，即可以返回一个迭代器。
Iterator的结构
Iterator仅用于遍历集合，Iterator 本身并不存放对象。

import java.util.ArrayList;
import java.util.Iterator;

public class Collection01 {
    public static void main(String[] args) {
        ArrayList al = new ArrayList();
        al.add("AA");
        al.add(11);
        al.add("三国演义");
        Iterator iterator = al.iterator();
        while (iterator.hasNext()) {
            Object obj = iterator.next();
            System.out.println(obj);
        }
    }
}

Collection接口遍历对象方式2-for循环增强

增强for循环，可以代替iterator迭代器，特点: 增强for就是简化版的iterator, 本质一样。只能用于遍历集合或数组。

基本语法

for(元素类型 元素名:集合名或数组名) {
	访问元素
}

List接口和常用方法

List接口是Collection接口的子接口

List集合类中元素有序(即添加顺序和取出顺序一致)、且可重复
List集合中的每个元素都有其对应的顺序索引，即支持索引。
List容器中的元素都对应一个整数型的序号记载其在容器中的位置，可以根据序号存取容器中的元素

List集合里添加了一些根据索引来操作集合元素的方法

void add(int index, Object ele):在index位置插入ele元素
boolean addAll(int index, Collection eles):从index位置开始将eles中的所有元素添加进来
Object get(int index):获取指定index位置的元素
int indexOf(Object obj):返回obj在集合中首次出现的位置
int lastIndexOf(Object obj):返回obj在当前集合中末次出现的位置
Object remove(int index):移除指定index位置的元素，并返回此元素
Object set(int index, Object ele):设置指定index位置的元素为ele , 相当于是替换
List subList(int fromIndex, int tolndex): 返回从fromIndex到tolndex位置的子集合

List[ArrayList, LinkedList, Vector]的三种遍历方式

方式一:使用iterator

方式二:使用增强for

方式三:使用普通for

ArrayList的注意事项

permits all elements, includling null , ArrayList可以加入nulI,并且多个
ArrayList是由数组来实现数据存储的
ArrayList基本等同于Vector ,除了ArrayList是线程不安全(执行效率高)看源码.
在多线程情况下，不建议使用ArrayList

ArrayList的底层操作机制源码分析

ArrayList中维护了-个Object类型的数组elementData. [debug 看源码]
transient Object[] elementData;
当创建对象时，如果使用的是无参构造器，则初始elementData容量为0 (jdk7是10)
当添加元素时:先判断是否需要扩容，如果需要扩容，则调用grow方法，否则直接添加元素到合适位置
如果使用的是无参构造器，如果第一次添加，需要扩容的话，则扩容elementData为10,
如果需要再次扩容的话，则扩容elementData为1.5倍。
如果使用的是指定容量capacity的构造器，则初始elementData容量为capacity
如果使用的是指定容量capacity的构造器，如果需要打容，则直接扩容elementData为 1.5倍。

Vector和ArrayList的比较

LinkedList底层结构

LinkedList底层实现了双向链表和双端队列特点
可以添加任意元素(元素可以重复)，包括null
线程不安全，没有实现同步

LinkedList的底层操作机制

LinkedList底层维护了一个双向链表.
LinkedList中维护了两个属性first和last分别指向首节点和尾节点
每个节点(Node对象) ,里面又维护了prev、next、 item三个属性，其中通过
prev指向前一个，通过next指向后一个节点。最终实现双向链表
所以LinkedList的元素的添加和删除，不是通过数组完成的，相对来说效率较高。
模拟一个简单的双向链表走代码

ArrayList和LinkedList的比较

这俩都是线程不安全的

如何选择ArrayList和LinkedList:
1)如果我们改查的操作多，选择ArrayList
2)如果我们增删的操作多，选择LinkedList
3)一般来说，在程序中，80%-90%都是查询，因此大部分情况下会选择ArrayList
4)在一个项目中，根据业务灵活选择，也可能这样，一个模块使用的是ArrayList,另外一个模块是LinkedList.

Set接口和常用方法

1 无序(添加和取出的顺序不一致)，没有索引
2 不允许重复元素，所以最多包含一个null
3 JDK APl中Set接口的实现类有: AbstractSet, ConcurrentSkipListSet, CopyOnWriteArraySet, EnumSet, HashSet, JobStateReasons, LinkedHashSet, TreeSet

和List接口一样，Set接口也是Collection的子接口，因此，常用方法和Collection接口一样.

同Collection的遍历方式一样，因为Set接口是Collection接口的子接口。
1.可以使用迭代器
2.增强for
3.不能使用索引的方式来获取元素.

HashSet的全面说明

HashSet实现了Set接口
HashSet实际上是HashMap，看下源码.
可以存放null值，但是只能有一个null
HashSet不保证元素是有序的,取决于hash后，再确定索引的结果.
不能有重复元素/对象.在前面Set接口使用已经讲过

HashSet底层机制说明

分析HashSet的添加元素底层是如何实现(hash() + equals())

HashSet 底层是HashMap
添加一个元素时，先得到hash值-会转成->索引值
找到存储数据表table ,看这个索引位置是否已经存放的有元素
如果没有，直接加入
如果有，调用equals比较，如果相同，就放弃添加，如果不相同，则添加到最后
在Java8中，如果条链表的元素个数超过TREEIFY THRESHOLD(默认是8)，并且table的大小 >=MIN_ TREEIFY CAPACITY(默认64),就会进行树化(红黑树)

HashSet的扩容和转成红黑树机制

HashSet底层是HashMap,第一次添加时，table 数组扩容到16,临界值(threshold)是 $16 * 加载因子 (l o a d F a c t o r) 是 0.75 = 12$ 如
如果table数组使用到了临界值12,就会扩容到16* 2 = 32,新的临界值就是32*0.75 = 24,依次类推
在Java8中，如果一条链表的元素个数到达TREEIFY THRESHOLD(默认是8 ),并且table的大小>=MIN TREEIFY CAPACITY(默认64),就会进行树化(红黑树)，否则仍然采用数组扩容机制

Set接口实现类 - LinkedHashSet

LinkedHashSet是HashSet的子类
LinkedHashSet底层是一个LinkedHashMap,底层维护了一个数组+双向链表
LinkedHashSet根据元素的hashCode值来决定元素的存储位置，同时使用链表维护元素的次序(图)，这使得元素看起来是以插入顺序保存的。
LinkedHashSet不允许添重复元素

Map接口和常用方法

注意:这里讲的是JDK8的Map接口特点 Map_ java

Map与Collection并列存在。用于保存具有映射关系的数据:Key-Value
Map中的key和value可以是任何引用类型的数据，会封装到HashMap$Node对象中
Map中的key不允许重复，原因和HashSet一样，前面分析过源码.
Map中的value可以重复
Map的key可以为null, value也可以为null，注意key为null,只能有一个，value为null ,可以多个.
常用String类作为Map的key
key和value之间存在单向一对一关系，即通过指定的key总能找到对应的value
Map存放数据的key-value示意图，-对k-v是放在一个Node中的，有因为Node实现了Entry接口，有些书上也说一对k-v就是一个Entry(如图)

常用方法

put:添加
remove:根据键删除映射关系
get:根据键获取值
size:获取元素个数
isEmpty:判断个数是否为0
clear:清除
containsKey:查找键是否存在

Map遍历方式

1)containsKey:查找键是否存在
2)keySet:获取所有的键
3)entrySet:获取所有关系k-v
4)values:获取所有的值

HashMap小结

Map接口的常用实现类: HashMap、 HashTable和Properties。
HashMap是Map接口使用频率最高的实现类。
HashMap是以key-val对的方式来存储数据(HashMap$Node)
key不能重复，但是是值可以重复，允许使用null键和null值。
如果添加相同的key，则会覆盖原来的key-val ,等同于修改.(key不会替换，val会替换)
与HashSet一样，不保证映射的顺序，因为底层是以hash表的方式来存储的.
HashMap没有实现同步，因此是线程不安全的

HashMap底层机制

HashMap底层维护了Node类型的数组table,默认为null
当创建对象时，将加载因子(loadfactor)初始化为0.75.
当添加key-val时，通过key的哈希值得到在table的索引。然后判断该索引处是否有元素，如果没有元素直接添加。如果该索引处有元素，继续判断该元素的key是否和准备加入的key相等，如果相等，则直接替换val;如果不相等需要判断是树结构还是链表结构，做出相应处理。如果添加时发现容量不够，则需要扩容。
第1次添加，则需要扩容table容量为16,临界值(threshold)为12.
以后再扩容，则需要扩容table容量为原来的2倍，临界值为原来的2倍,即24,依次类推
在Java8中，如果一条链表的元素个数超过TREEIFY THRESHOLD(默认是8)，并且table的大小>= MIN TREEIFY CAPACITY(默认64),就会进行树化(红黑树)

Map接口实现类 -HashTable的基本介绍

存放的元素是键值对:即K-V
hashtable的键和值都不能为null,否则会抛出NullPointerException
hashTable使用方法基本上和HashMap-样
hashTable是线程安全的，hashMap 是线程不安全的
简单看下底层结构

Map接口实现类 - Properties基本介绍

Properties类继承自Hashtable类并且实现了Map接口，也是使用一种键值对的形式来保存数据。
他的使用特点和Hashtable类似
Properties 还可以用于从xxx.properties文件中，加载数据到Properties类对象，并进行读取和修改
说明: 工作后xx.properties 文件通常作为配置文件，这个知识点在I0流举例，有兴趣可先看文章

总结-开发中如何选择集合实现类

1)先判断存储的类型(一组对象[单列]或一组键值对[双列])
2)一组对象[单列]: Collection接口
允许重复: List
增删多: LinkedList [底层维护了一个双向链表]
改查多: ArrayList [底层维护Object类型的可变数组]
不允许重复: Set
无序: HashSet [底层是HashMap ,维护了一个哈希表即(数组+链表红黑树)]
排序: TreeSet
插入和取出顺序一致: LinkedHashSet ，维护数组+双向链表
3)一组键值对:Map
键无序: HashMap [底层是:哈希表jdk7: 数组+链表，jdk8:数组+链表+红黑树]
键排序: TreeMap
键插入和取出顺序一致: LinkedHashMap
读取文件Properties