亲宝软件园·资讯

展开

java常用容器简要性能分析(List。Map。Set)

意必固我 人气:0

 

嗯,实习的时候看到这个,感觉蛮好,这里摘录学习,生活加油:

我曾经害怕别人嘲笑的目光,后来,发现他们的目光不会在我身上停留太久,人们更愿意把目光放在自己身上。 知乎上看到,讲给自己。

List

List和Set都属于Collection的子接口,List集合中的元素是按照插入顺序进行排列的,允许出现重复元素,

List接口下的常用实现类有ArrayList和LinkedList,对于List来讲,

元素只能是通过set更新,不能通过add更新,通过add只能在指定索引位置添加元素,不会实现元素的覆盖,通过remove移除

接口继承关系:

ArrayList :

// 查找指定位置元素的下标
public int indexOf(Object o);
// 查找指定元素最后一次出现的位置
public int lastIndexOf(Object o) ;
// 清空集合元素
public void clear();
// 等等......

 


ArrayList的特点: **

  • ArrayList内部是使用数组来存储数据,并且是一个"动态"的数组,在添加元素时,如果发现容量不够时,会进 行扩容。
  • ArrayList支持随机访问元素,随机访问元素的效率是O(1)
  • ArrayList在尾部添加元素的效率为O(1),add方法默认在尾部进行添加,在使用的时候最好在尾部添加元素 效率更佳
  • ArrayList在进行删除元素或者在中间、头部插入元素时会导致数组内部移动,进行数组拷贝,平均时间复杂度 为O(n) 

ArrayList的迭代方式:

  1. 1、下标迭代
// 使用下标对List进行外部迭代
for (int i = 0; i < list.size(); i++) { System.out.println(list.get(i));}
  1. 2、可以使用增强for进行迭代
// 采用增强for的迭代方式其实底层是使用迭代器进行迭代,在迭代的过程中不允许对元素进行修改
for (String s : list) { System.out.println(s);}
  1. 3、采用内部迭代的方式
// 内部迭代forEach,在迭代的过程中仍然不允许对元素进行修改过删除操作
list.forEach(item -> System.out.println(item));
// 内部迭代还支持并行方式对元素进行迭代 如果数据量非常大的时候可以采用该方式(一般不采用)迭代出来的元素可能无序
list.parallelStream().forEach(System.out::println);

 

list.stream().forEach(System.out::print);

 

  1. 4、内部迭代底层实现
public void forEach(Consumer<? super E> action) { Objects.requireNonNull(action);
final int expectedModCount = modCount; @SuppressWarnings("unchecked")
final E[] elementData = (E[]) this.elementData; final int size = this.size;
for (int i=0; modCount == expectedModCount && i < size; i++) { action.accept(elementData[i]);
}
if (modCount != expectedModCount) {
throw new ConcurrentModificationException();
}
}
  1. 5、使用迭代器进行迭代
// 直接使用迭代器进行迭代 这种迭代方式允许在迭代中对元素进行修改和删除操作
Iterator<Long> iterator = list.iterator(); while (iterator.hasNext()){
System.out.println(iterator.next());
}

几种迭代方式的性能比较
在数据规模为一千万的情况下内部迭代表现较好,尽管在千万级的数据量并行迭代依然速度不快,因为在线程的频换 切换和销毁等因素造成了一定的开销。

在百万数据规模的情况下,增强for的性能较好,可以根据数据量来对元素进行迭代,fori方式和增强for性能差异不是很大。

 

LinkedList:

LinkedList继承自AbstractSequentialList可以知道LinkedList的元素是顺序访问的,随机访问元素需要对链表进行遍历, 同样实现了克隆和序列化接口LinkedList还实现了Deque相关的方法,可以当做一个队列来使用
LinkedList的类继承关系

LinkedList的特点:

  1. LinkedList的内部数据结构是一个双向链表,有一个头结点和一个尾部节点,在头部和尾部插入的效率非常高O(1)
  2. LinkedList的平均查找效率为O(n)
  3. LinkedList的删除和修改都需要先定位元素的位置,但是对于删除操作本身只需要O(1)的时间复杂度LinkedList因为采用了链表结构,所以理论空间是没有限制的,不需要扩容
  4. LinkedList在使用下标访问元素的时候使用了折半查找,但是在数据量大的情况下,查找效率依然很慢 便于用作LRU

LinkedList的迭代方式

  • LinkedList的迭代方式其实和ArrayList大同小异,但是ArrayList在进行get(index)的操作只需要O(1)的时间复杂度

所以我们在使用LinkedList的时候不采用fori形式的遍历

  • 增强for方式进行遍历,其实相当于使用迭代器进行访问,增强for反编译以后其实就是iterator
  • 使用迭代器对链表进行迭代,Linked的迭代器内部就是从头节点开始依次向下寻找节点
  • 使用内部迭代forEach方式

几种迭代方式的比较:

  1. LinkedList使用增强for方式进行遍历速度较快,使用该fori进行遍历时候,在百万级数据量程序直接卡死,所以LinkedList严禁使用fori遍历  
    1.  
  2. 在千万级别数据量的情况下,速度和ArrayList差不多,但ArrayList较快,因为ArrayList数据空间是连续的  
    1.  

ArrayList和LinkedList的区别

  • 是否保证线程安全: ArrayList 和 LinkedList 都是不同步的,也就是不保证线程安全;
  • 底层数据结构: Arraylist 底层使用的是Object数组;LinkedList 底层使用的是双向链表数据结构(JDK1.6之前为循环链表,JDK1.7取消了循环。注意双向链表和双向循环链表的区别,下面有介绍到!)
  • 插入和删除是否受元素位置的影响:
    • ① ArrayList 采用数组存储,所以插入和删除元素的时间复杂度受元素位置的影响。 比如:执行add(E e)方法的时候, ArrayList 会默认在将指定的元素追加到此列表的末尾,这种情况时间复杂度就是O(1)。但是如果要在指定位置 i 插入和删除元素的话(add(int index, E element))时间复杂度就为 O(n-i)。因为在进行上述操作的时候集合中第 i 和第 i 个元素之后的(n-i)个元素都要执行向后位/向前移一位的操作。
    • ② LinkedList 采用链表存储,所以插入,删除元素时间复杂度不受元素位置的影响,都是近似 O(1)而数组为近似 O(n)。
  • 是否支持快速随机访问: LinkedList 不支持高效的随机元素访问,而 ArrayList 支持。快速随机访问就是通过元素的序号快速获取元素对象(对应于get(int index)方法)。
  • 内存空间占用: ArrayList的空 间浪费主要体现在在list列表的结尾会预留一定的容量空间,而LinkedList的空间花费则体现在它的每一个元素都需要消耗比ArrayList更多的空间(因为要存放直接后继和直接前驱以及数据)

Map:

Map是双列集合,即存储元素的时候是键值对的形式在Map中存储的,一个Entry<K,V>结构的键值对映射,一个键对 应一个值,不允许出现重复的键,


HashMap

HashMap的类继承关系:

  • HashMap继承自AbstractMap同样一个抽象类的出现是为了实现一些子类通用的方法,一些个性化的方法还需要子类 去实现
  • HashMap内部是使用了散列表+红黑树进行存储数据的,即数组+链表+红黑树

HashMap的特点

  • HashMap使用位运算将HashMap中数组的大小一定是2的N次方,保证了在取出元素时候通过与运算能更高效 和更精确的定位数组下标 
    •   
  • 即使两个不一样的元素也可能会出现同样的hashCode,HashMap使用拉链法设计解决了Hash冲突问题,同一个散列槽(在我们这里就是数组的每一个槽)中的所有元素放到一个链表中
  • HashMap在某一个槽上的链表长度大于等于8的时候并且HashMap中数组的长度大于等于64会进行树化,将 链表转换成红黑树以提升查询效率
  • 在增删改查元素的时候平均时间复杂度为O(1)非常高效
  • HashMap在插入的时候允许空键空值
  • HashMap是非同步的,多线程同时操作的时候会发生并发修改异常

HashMap的迭代方式

  • 通过keySet||valueSet进行遍历
// 获取到所有的key然后依次进行获取
Set<Integer> keySet = map.keySet(); Integer val = 0;
for (Integer key : keySet) { val = map.get(key);
System.out.print("");
}
  • 通过entrySet对map进行遍历
Set<Map.Entry<Integer, Integer>> entrySet = map.entrySet();
for (Map.Entry<Integer, Integer> entry : entrySet) {
System.out.print("");
}
  • 使用内部迭代
Map<Object,Object> objectObjectMap = new HashMap<>();
objectObjectMap.forEach( (o1, o2) ->System.out.println(o1.toString()+o2));
// 内部迭代底层依然是使用entrySet进行迭代,效率不如直接使用外部迭代
default void forEach(BiConsumer<? super K, ? super V> action) { Objects.requireNonNull(action);
for (Map.Entry<K, V> entry : entrySet()) { K k;
V v; try {
k = entry.getKey();
v = entry.getValue();
} catch(IllegalStateException ise) {
// this usually means the entry is no longer in the map. throw new ConcurrentModificationException(ise);
}
action.accept(k, v);
}
}

 几种迭代方式的性能差异

 

 


LinkedHashMap:

LinkedHashMap是HashMap的一个子类,内部维护了一个双向链表保证了元素插入的顺序

HashMap的类继承关系

  

 

 

 

 

 

LinkedHashMap的数据结构

 

 

 

 

 

LinkedHashMap的特点

  • LinkedHashMap是HashMap的子类,其增删改查的平均时间复杂度依然是O(1)
  • LinkedHashMap的节点占用了更多的空间,包括指向前一个节点的指针before和指向后一个节点的after指针
  • LinkedHashMap默认使用插入顺序进行遍历,也可以使用访问顺序,将accessOrder置为true即可

LinkedHashMap的迭代方式

  • 使用keySet进行遍历,keySet返回的是一个LinkedKeySet,LinkedKeySet的遍历方式是按照插入时候的顺序
  • 使用entrySet进行遍历,返回LinkedEntrySet
  • 使用内部迭代forEach
public void forEach(BiConsumer<? super K, ? super V> action) { if (action == null)
throw new NullPointerException(); int mc = modCount;
for (LinkedHashMap.Entry<K,V> e = head; e != null; e = e.after) action.accept(e.key, e.value);
if (modCount != mc)
throw new ConcurrentModificationException();
}

 TreeMap

 TreeMap中的元素默认按照keys的自然排序排列。(对Integer来说,其自然排序就是数字的升序;对String来说,其自然排序就是按照字母表排序)

 TreeMap的定义如下:

public class TreeMap<K,V>
extends AbstractMap<K,V>
implements NavigableMap<K,V>, Cloneable, java.io.Serializable

 TreeMap继承AbstractMap,实现NavigableMap、Cloneable、Serializable三个接口。其中AbstractMap表明TreeMap为一个Map即支持key-value的集合, NavigableMap(更多)则意味着它支持一系列的导航方法,具备针对给定搜索目标返回最接近匹配项的导航方法 。

       TreeMap中同时也包含了如下几个重要的属性:

//比较器,因为TreeMap是有序的,通过comparator接口我们可以对TreeMap的内部排序进行精密的控制
private final Comparator<? super K> comparator;
//TreeMap红-黑节点,为TreeMap的内部类
private transient Entry<K,V> root = null;
//容器大小
private transient int size = 0;
//TreeMap修改次数
private transient int modCount = 0;
//红黑树的节点颜色--红色
private static final boolean RED = false;
//红黑树的节点颜色--黑色
private static final boolean BLACK = true;

对于叶子节点Entry是TreeMap的内部类,它有几个重要的属性:

//键
K key;
//值
V value;
//左孩子
Entry<K,V> left = null;
//右孩子
Entry<K,V> right = null;
//父亲
Entry<K,V> parent;
//颜色
boolean color = BLACK;

 数据结构:基于红黑树的一种实现,红黑树是自平横的二叉搜索树。二叉搜索树是排序好的二叉树。

 Set

Set集合存储元素的特点就是,set存储元素都是无序并且不可重复的,比较常用的两种有HashSet和TreeSet
HashSet:

HashSet的类继承关系

 

 


Hashset的顶级接口是Collection接口,属于单列集合,即每次存储一个元素
HashSet的数据结构

private transient HashMap<E,Object> map;// 内部维护了一个map,其底层实现靠的就是HashMap,键用于存放值

// Dummy value to associate with an Object in the backing Map
private static final Object PRESENT = new Object();// 这个空的Object对象作为所有的默认Value

/**
*Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
*default initial capacity (16) and load factor (0.75).
*/
public HashSet() {
map = new HashMap<>();
}

// add方法其实就是调用了map的put,并传入一个空的value 
public boolean add(E e) { return map.put(e, PRESENT)==null; }

 因为Set的元素和HashMap中的键是有相同的特征的,HashSet充分利用了HashMap的功能

HashSet的特点:

  • 存储元素时会去重,即集合中的元素都是不可重复的
  • HashSet没有get方法,其实道理也很显而易见,因为元素是无序的所以不能根据下标来访问元素
  • HashSet的本质就是HashMap

HashSet的迭代方式:

  • 使用迭代器进行迭代,其实本质上返回的就是HashMap的keySet
public Iterator<E> iterator() { return map.keySet().iterator();
}
  • 使用forEach进行内部迭代,性能不如直接使用迭代器
set.forEach(k->System.out.println(k));

TreeSet

TreeSet是基于TreeMap实现的,TreeSet的元素支持2种排序方式:自然排序或者根据提供的Comparator进行排序。

继承关系:

 

 


TreeSet的特点

  • TreeSet中存储的元素是有序且不可重复的,所谓有序就是按照元素自身的排序顺序,或者使用者自定义比较 方式
  • 和HashSet类似TreeSet的底层实现就是TreeMap
public TreeSet() {
this(new TreeMap<E,Object>());
}

 

加载全部内容

相关教程
猜你喜欢
用户评论