在Java中如何使用HashSet去重集合元素

答案:HashSet通过hashCode和equals方法实现去重,需重写这两个方法以确保自定义对象正确去重。示例显示对String和Person类去重,并可将结果转为List。

在Java中,HashSet 是基于哈希表实现的 Set 接口,它的一个重要特性就是不允许重复元素。因此,使用 HashSet 是去除集合中重复元素的一种简单高效的方法。

HashSet 去重的基本原理

HashSet 通过对象的 equals()hashCode() 方法来判断两个元素是否相等。当向 HashSet 添加元素时:

  • 先调用该对象的 hashCode() 方法获取哈希值,确定存储位置。
  • 如果该位置已有元素,则调用 equals() 方法比较是否真正相同。
  • 如果相同,新元素不会被添加,从而实现去重。

因此,为了正确去重,存入 HashSet 的对象必须正确重写 hashCode()equals() 方法。

基本使用示例:去重简单类型

对于 Java 中的包装类型(如 String、Integer),这些类已经重写了 hashCode 和 equals,可以直接去重:

import java.util.*;

public class RemoveDuplicates {
    public static void main(String[] args) {
        List list = Arrays.asList("apple", "banana", "apple", "orange", "banana");
        Set set = new HashSet<>(list);
        System.out.println(set); // 输出:[banana, orange, apple](顺序不保证)
    }
}

自定义对象去重:需重写 hashCode 和 equals

如果你的集合中是自定义对象(例如 Person 类),必须手动重写 hashCode()equals() 方法,否则即使内容相同也会被视为不同对象。

class Person {
    private String name;
    private int age;

    public Person(String name, int age) {
        this.name = name;
      

this.age = age; } @Override public boolean equals(Object o) { if (this == o) return true; if (!(o instanceof Person)) return false; Person person = (Person) o; return age == person.age && Objects.equals(name, person.name); } @Override public int hashCode() { return Objects.hash(name, age); } @Override public String toString() { return "Person{name='" + name + "', age=" + age + '}'; } } // 使用示例 public class Main { public static void main(String[] args) { List people = Arrays.asList( new Person("Alice", 25), new Person("Bob", 30), new Person("Alice", 25) ); Set uniquePeople = new HashSet<>(people); System.out.println(uniquePeople); // 输出:[Person{name='Alice', age=25}, Person{name='Bob', age=30}] } }

将去重结果转回列表

有时需要把去重后的数据还原为 List,可以这样操作:

List noDuplicates = new ArrayList<>(new HashSet<>(originalList));

这行代码利用 HashSet 去重,再构造一个新的 ArrayList。

基本上就这些。只要注意自定义类要重写 equalshashCode,使用 HashSet 去重非常方便。不复杂但容易忽略细节。