在Java里如何使用TreeSet实现排序集合_Java集合排序与树结构说明

TreeSet底层基于红黑树(通过TreeMap实现),天然去重、有序,增删查均为O(log n);要求元素可比较(Comparable或Comparator),不支持null;迭代顺序即排序顺序,非插入顺序;subSet等返回实时视图。

TreeSet 本质是红黑树,不是简单排序工具

TreeSet 底层用的是 TreeMap,它本身不存储元素,而是把元素作为 key 存进 TreeMap,value 固定为 PRESENT(一个静态 Object)。这意味着:它天然去重、自动按顺序维护,但**不是靠插入后调用 sort() 实现的**,而是在每次 add() 时就通过红黑树的插入逻辑完成位置调整。

  • 不能存 null(否则抛 NullPointerException
  • 元素必须实现 Comparable 接口,或构造时传入

    Comparator,否则运行时报 ClassCastException
  • 增删查时间复杂度都是 O(log n),比 HashSet 慢,但比 ArrayList + Collections.sort() 在频繁增删场景下稳定得多

添加自定义对象时必须处理比较逻辑

比如有一个 Person 类,直接丢进 TreeSet 会报错:

Exception in thread "main" java.lang.ClassCastException: Person cannot be cast to java.lang.Comparable

解决方式有两种,选其一即可:

  • 让类实现 Comparable,重写 compareTo()(推荐用于自然排序逻辑明确的场景)
  • 构造 TreeSet 时传入 Comparator(适合临时排序、多字段组合、或无法修改类源码的情况)

例如按年龄升序:

TreeSet set = new TreeSet<>((p1, p2) -> Integer.compare(p1.getAge(), p2.getAge()));

注意:如果用了 lambda 写 Comparator,后续往集合里加的每个 Person 都必须非空,否则 getAge() 可能 NPE —— 这个空指针不会在 add() 时报,而是在红黑树比较节点时触发,堆栈难定位。

TreeSet 的“有序”是迭代顺序,不是插入顺序

它不保留你 add() 的先后次序,只保证按比较规则从小到大(或按 Comparator 定义的顺序)排列。比如:

TreeSet set = new TreeSet<>();
set.add(5);
set.add(1);
set.add(3);
// 迭代结果一定是 [1, 3, 5],不是 [5, 1, 3]

如果你需要「插入顺序 + 去重」,该用 LinkedHashSet;如果需要「插入顺序 + 可重复 + 排序视图」,得自己维护 ArrayList 并手动 Collections.sort(),别硬套 TreeSet

另外,TreeSetfirst()last()higher()lower() 等方法非常高效,适合做范围查询或找极值,但别误以为它支持随机索引访问 —— 它没有 get(int index)

小心 subSet / headSet / tailSet 返回的是视图,不是副本

这些方法返回的子集是原 TreeSet 的**实时视图**,对子集的修改会直接影响原集合,反之亦然:

TreeSet set = new TreeSet<>(Arrays.asList(1, 3, 5, 7, 9));
SortedSet sub = set.subSet(3, true, 7, true); // [3, 5, 7]
sub.add(4); // set 现在变成 [1, 3, 4, 5, 7, 9]
set.remove(5); // sub 现在变成 [3, 4, 7]

如果不希望联动,得显式复制:

TreeSet copy = new TreeSet<>(sub);

这个特性容易被忽略,尤其在多线程或分层处理逻辑中,可能引发意料外的状态污染。