Java开发中常用的数据结构

William一直在路上

于 2025-07-02 06:00:00 发布

阅读量461

点赞数 11

CC 4.0 BY-SA版权

分类专栏：职业重启计划文章标签： java 数据结构开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/crazycoldking2015/article/details/149041536

职业重启计划专栏收录该内容

35 篇文章

订阅专栏

Java中的数据结构丰富多样，不同结构在存储方式、访问效率和适用场景上各有优劣。以下从线性结构、集合类、映射类、队列/栈、特殊数据结构五个维度，系统梳理常用数据结构的特性与应用场景。

一、线性结构：List家族

1. ArrayList

数据结构：动态数组（基于数组实现）
适用场景：
- 频繁随机访问（如分页查询、数组索引操作）
- 数据量可预测的场景（如报表数据展示）
优点：
- 随机访问时间复杂度O(1)，性能优异
- 内存连续，缓存友好（CPU缓存命中率高）
缺点：
- 插入/删除操作需移动元素，时间复杂度O(n)
- 扩容时需复制数组，消耗额外性能
底层实现：Object[] elementData，扩容时新数组大小为原数组的1.5倍

2. LinkedList

数据结构：双向链表（每个节点包含前驱和后继指针）
适用场景：
- 频繁插入/删除操作（如聊天消息列表、日志记录）
- 不确定数据量的场景（无需预先分配空间）
优点：
- 插入/删除时间复杂度O(1)（仅需修改指针）
- 内存非连续，适合存储零散数据
缺点：
- 随机访问需遍历链表，时间复杂度O(n)
- 每个节点额外存储指针，内存占用比ArrayList高约50%
底层实现：Node<E>节点类，包含prev和next指针

二、集合类：Set家族

1. HashSet

数据结构：哈希表（本质是HashMap的key集合）
适用场景：
- 快速去重（如统计用户唯一访问ID）
- 元素查找（如判断某元素是否存在）
优点：
- 插入、查找、删除时间复杂度平均O(1)
- 实现简单，性能高效
缺点：
- 不保证元素顺序（迭代顺序不确定）
- 哈希冲突时性能下降（通过链表或红黑树解决）
底层实现：基于HashMap，值统一为PRESENT对象

2. TreeSet

数据结构：红黑树（自平衡二叉搜索树）
适用场景：
- 元素需要自动排序（如排行榜、有序数据展示）
- 范围查询（如查询分数在80-90之间的学生）
优点：
- 有序性：迭代顺序按自然排序或自定义比较器
- 范围查询效率高（如subSet(from, to)）
缺点：
- 插入、删除时间复杂度O(log n)，比HashSet慢
- 实现复杂，内存占用更高
底层实现：TreeMap的key集合，红黑树节点包含颜色属性

3. LinkedHashSet

数据结构：哈希表+双向链表
适用场景：
- 需要保持插入顺序（如历史记录、访问日志）
- 兼顾去重和顺序性的场景
优点：
- 插入、查找效率接近HashSet（O(1)）
- 迭代顺序与插入顺序一致
缺点：
- 每个节点额外存储前后指针，内存占用比HashSet高
底层实现：继承HashSet，添加双向链表维护顺序

三、映射类：Map家族

1. HashMap

数据结构：哈希表（数组+链表+红黑树）
适用场景：
- 高性能键值查询（如缓存、字典查找）
- 单线程环境下的高频读写操作
优点：
- 平均读写时间复杂度O(1)（哈希算法优化）
- 空间利用率高，实现简洁
缺点：
- 线程不安全（多线程并发修改可能导致死循环）
- 哈希冲突时性能波动（JDK1.8后链表转红黑树优化）
底层实现：Node<K,V>数组，冲突时用链表或红黑树解决

2. ConcurrentHashMap

数据结构：分段哈希表（JDK1.8后改为CAS+红黑树）
适用场景：
- 多线程环境下的高频读写（如计数器、分布式锁）
- 高并发场景的缓存服务
优点：
- 线程安全，支持高并发（JDK1.8后吞吐量提升10倍）
- 读操作无锁，性能优于Hashtable
缺点：
- 实现复杂，调试难度高
- 比HashMap内存占用高约10%-15%
底层实现：Node<K,V>数组+CAS操作，分段锁优化（JDK1.8后取消分段锁）

3. TreeMap

数据结构：红黑树
适用场景：
- 按键排序的场景（如按时间排序的订单数据）
- 范围查询（如查询价格在100-200之间的商品）
优点：
- 按键有序，支持firstKey()、lastKey()等操作
- 范围查询效率高（O(log n)）
缺点：
- 读写效率低于HashMap（O(log n) vs O(1)）
底层实现：红黑树节点，每个节点包含颜色、左右子节点

4. LinkedHashMap

数据结构：哈希表+双向链表
适用场景：
- LRU缓存（通过removeEldestEntry实现淘汰策略）
- 需要保持插入顺序或访问顺序的映射
优点：
- 迭代顺序可控（插入顺序或访问顺序）
- 缓存场景下淘汰效率高
缺点：
- 内存占用比HashMap高约20%
底层实现：继承HashMap，添加双向链表维护顺序

四、队列与栈

1. LinkedList（实现Queue接口）

数据结构：双向链表
适用场景：
- 先进先出（FIFO）场景（如任务队列、打印队列）
优点：
- 插入、删除效率高（O(1)）
- 支持双向遍历
缺点：
- 随机访问效率低（O(n)）

2. PriorityQueue

数据结构：最小堆（或最大堆）
适用场景：
- 优先级任务调度（如线程池中的任务队列）
- top-N问题（如查询最热的10条新闻）
优点：
- 插入、获取极值时间复杂度O(log n)
- 自动维护元素优先级
缺点：
- 不支持高效的随机访问
底层实现：基于数组的堆结构，通过上浮下沉算法维护堆性质

3. ArrayBlockingQueue

数据结构：固定大小数组+锁
适用场景：
- 生产者-消费者模式（如日志收集、消息处理）
优点：
- 线程安全，支持阻塞操作（put/take）
- 容量固定，避免OOM风险
缺点：
- 容量不可动态扩展
底层实现：Object[] items数组，ReentrantLock实现线程安全

4. Stack

数据结构：基于Vector的栈（后进先出，LIFO）
适用场景：
- 表达式求值（如中缀表达式转后缀表达式）
- 回溯算法（如迷宫寻路）
优点：
- 接口简单，符合LIFO语义
缺点：
- 继承自Vector，方法同步导致性能开销
- 不如自定义链表栈高效

五、特殊数据结构

1. BitSet

数据结构：位向量（用位表示布尔值）
适用场景：
- 海量数据去重（如布隆过滤器）
- 位运算场景（如权限掩码）
优点：
- 存储空间小（1位表示一个元素）
- 位运算效率高
缺点：
- 不支持泛型，仅能存储布尔值

2. WeakHashMap

数据结构：弱引用哈希表
适用场景：
- 缓存场景但需避免内存泄漏（如临时数据缓存）
优点：
- 键使用弱引用，GC时会自动释放不再使用的键值对
缺点：
- 无法保证数据存在性（可能被GC回收）

六、数据结构选型决策矩阵

场景需求	推荐数据结构	不推荐结构	核心原因
频繁随机访问	ArrayList	LinkedList	数组索引访问O(1)
频繁插入删除	LinkedList	ArrayList	链表指针操作O(1)
元素去重且无序	HashSet	TreeSet	哈希表效率更高
元素去重且有序	TreeSet/LinkedHashSet	HashSet	维持顺序需要额外结构
多线程高并发读写	ConcurrentHashMap	HashMap	线程安全且性能更优
LRU缓存	LinkedHashMap	HashMap	内置顺序维护机制
优先级任务调度	PriorityQueue	LinkedList	堆结构高效维护优先级

总结：数据结构选择的核心原则

场景优先：
- 随机访问选ArrayList，频繁插入选LinkedList
- 高性能键值查询选HashMap，多线程选ConcurrentHashMap
性能权衡：
- 空间换时间：HashMap用额外空间换O(1)查询
- 时间换空间：TreeSet用O(log n)操作换有序性
底层实现认知：
- 理解数组、链表、哈希表、树的特性，避免“一刀切”选型
- 如：TreeSet的红黑树实现决定了它适合有序场景，而非高性能场景

通过掌握不同数据结构的特性与适用场景，可在开发中做出更优选择，提升系统性能和稳定性。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。