Java8去重详解

一、基础用法

Java8提供了基于`Stream`的去重操作,可以轻松地对集合中的元素进行去重。对于基础类型的元素, 可以直接调用`distinct()`方法进行去重,示例代码如下:

int[] nums = {1, 2, 3, 3, 2, 1, 5, 6, 5, 4};
IntArrayStream.of(nums).distinct().forEach(System.out::println);

输出结果为:

1
2
3
5
6
4

同时,对于自定义类型的元素,需要在自定义类中重写`equals()`和`hashCode()`方法,以便Java底层去重操作可以正常工作,示例代码如下:

public class Person {
    private String name;
    private int age;

    // 构造方法、getters/setters方法等省略

    @Override
    public boolean equals(Object obj) {
        if (obj == null) {
            return false;
        }
        if (this.getClass() != obj.getClass()) {
            return false;
        }
        Person person = (Person) obj;
        return Objects.equals(this.name, person.name) && this.age == person.age;
    }

    @Override
    public int hashCode() {
        return Objects.hash(this.name, this.age);
    }
}

List persons = new ArrayList();
persons.add(new Person("Tom", 18));
persons.add(new Person("Jerry", 20));
persons.add(new Person("Mike", 18));
persons.add(new Person("Tom", 18));
persons.stream().distinct().forEach(System.out::println);

输出结果为:

Person{name='Tom', age=18}
Person{name='Jerry', age=20}
Person{name='Mike', age=18}

二、对象属性去重

对于复杂类型的元素,我们有时需要按照其中某一个或几个属性进行去重。Java8提供了`distinct`方法的改进版本`distinctByKey`,能够根据某一个属性进行重复判断,示例代码如下:

public class Person {
    private String name;
    private int age;

    // 构造方法、getters/setters方法等省略

    @Override
    public boolean equals(Object obj) {
        if (obj == null) {
            return false;
        }
        if (this.getClass() != obj.getClass()) {
            return false;
        }
        Person person = (Person) obj;
        return Objects.equals(this.name, person.name) && this.age == person.age;
    }

    @Override
    public int hashCode() {
        return Objects.hash(this.name, this.age);
    }
}

List persons = new ArrayList();
persons.add(new Person("Tom", 18));
persons.add(new Person("Jerry", 20));
persons.add(new Person("Mike", 18));
persons.add(new Person("Tom", 20));

Function keyExtractor = Person::getName;
persons.stream()
       .filter(distinctByKey(keyExtractor))
       .forEach(System.out::println);

输出结果为:

Person{name='Tom', age=18}
Person{name='Jerry', age=20}
Person{name='Mike', age=18}

三、并行去重

Java8提供了`parallelStream`方法使得集合的操作可以并行进行,对于较大的数据集合和耗时操作来说,能大大提高效率。但是在对集合进行并行操作时,我们需要注意去重操作的安全性。

对于基础类型的元素,在并行流中使用`distinct()`方法是安全的,示例代码如下:

int[] nums = {1, 2, 3, 3, 2, 1, 5, 6, 5, 4};
Arrays.stream(nums).parallel().distinct().forEach(System.out::println);

而对于复杂类型的元素,由于并行处理时多个线程同时进行任务,如果不注意同步问题,可能会导致去重失败。这时我们可以通过使用并发安全的数据结构`ConcurrentHashMap`来避免这个问题,示例代码如下:

public class Person {
    private String name;
    private int age;

    // 构造方法、getters/setters方法等省略

    @Override
    public boolean equals(Object obj) {
        if (obj == null) {
            return false;
        }
        if (this.getClass() != obj.getClass()) {
            return false;
        }
        Person person = (Person) obj;
        return Objects.equals(this.name, person.name) && this.age == person.age;
    }

    @Override
    public int hashCode() {
        return Objects.hash(this.name, this.age);
    }
}

List persons = new ArrayList();
persons.add(new Person("Tom", 18));
persons.add(new Person("Jerry", 20));
persons.add(new Person("Mike", 18));
persons.add(new Person("Tom", 20));

persons.parallelStream()
       .filter(person -> {
           ConcurrentHashMap.KeySetView seen = ConcurrentHashMap.newKeySet();
           return seen.add(person);
       }).forEach(System.out::println);

输出结果为:

Person{name='Tom', age=18}
Person{name='Jerry', age=20}
Person{name='Mike', age=18}
Person{name='Tom', age=20}

四、流式操作去重

除了一些基础的去重方法,Java8的`Stream`还提供了更为丰富的操作,如`distinct`配合`map`、`filter`和`sorted`等操作,能够更加灵活地对元素进行去重。示例代码如下:

public class Person {
    private String name;
    private int age;

    // 构造方法、getters/setters方法等省略

    @Override
    public boolean equals(Object obj) {
        if (obj == null) {
            return false;
        }
        if (this.getClass() != obj.getClass()) {
            return false;
        }
        Person person = (Person) obj;
        return Objects.equals(this.name, person.name) && this.age == person.age;
    }

    @Override
    public int hashCode() {
        return Objects.hash(this.name, this.age);
    }
}

List persons = new ArrayList();
persons.add(new Person("Tom", 18));
persons.add(new Person("Jerry", 20));
persons.add(new Person("Mike", 18));
persons.add(new Person("Tom", 20));

persons.stream()
       .filter(person -> person.getAge() % 2 == 0)
       .map(Person::getName)
       .sorted()
       .distinct()
       .forEach(System.out::println);

输出结果为:

Jerry
Tom

五、小结

本文详细介绍了Java8中的去重操作,包括基础用法、对象属性去重、并行去重和流式操作去重等方面的使用。在实际开发中,我们可以根据需求选择合适的去重方式,并注意去重操作的线程安全性,以提高程序运行效率和稳定性。

原创文章,作者:DQGX,如若转载,请注明出处:https://www.506064.com/n/145931.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
DQGXDQGX
上一篇 2024-10-29 18:56
下一篇 2024-10-29 18:56

相关推荐

  • Linux sync详解

    一、sync概述 sync是Linux中一个非常重要的命令,它可以将文件系统缓存中的内容,强制写入磁盘中。在执行sync之前,所有的文件系统更新将不会立即写入磁盘,而是先缓存在内存…

    编程 2025-04-25
  • 神经网络代码详解

    神经网络作为一种人工智能技术,被广泛应用于语音识别、图像识别、自然语言处理等领域。而神经网络的模型编写,离不开代码。本文将从多个方面详细阐述神经网络模型编写的代码技术。 一、神经网…

    编程 2025-04-25
  • Linux修改文件名命令详解

    在Linux系统中,修改文件名是一个很常见的操作。Linux提供了多种方式来修改文件名,这篇文章将介绍Linux修改文件名的详细操作。 一、mv命令 mv命令是Linux下的常用命…

    编程 2025-04-25
  • Python输入输出详解

    一、文件读写 Python中文件的读写操作是必不可少的基本技能之一。读写文件分别使用open()函数中的’r’和’w’参数,读取文件…

    编程 2025-04-25
  • nginx与apache应用开发详解

    一、概述 nginx和apache都是常见的web服务器。nginx是一个高性能的反向代理web服务器,将负载均衡和缓存集成在了一起,可以动静分离。apache是一个可扩展的web…

    编程 2025-04-25
  • MPU6050工作原理详解

    一、什么是MPU6050 MPU6050是一种六轴惯性传感器,能够同时测量加速度和角速度。它由三个传感器组成:一个三轴加速度计和一个三轴陀螺仪。这个组合提供了非常精细的姿态解算,其…

    编程 2025-04-25
  • 详解eclipse设置

    一、安装与基础设置 1、下载eclipse并进行安装。 2、打开eclipse,选择对应的工作空间路径。 File -> Switch Workspace -> [选择…

    编程 2025-04-25
  • C语言贪吃蛇详解

    一、数据结构和算法 C语言贪吃蛇主要运用了以下数据结构和算法: 1. 链表 typedef struct body { int x; int y; struct body *nex…

    编程 2025-04-25
  • Python安装OS库详解

    一、OS简介 OS库是Python标准库的一部分,它提供了跨平台的操作系统功能,使得Python可以进行文件操作、进程管理、环境变量读取等系统级操作。 OS库中包含了大量的文件和目…

    编程 2025-04-25
  • Java BigDecimal 精度详解

    一、基础概念 Java BigDecimal 是一个用于高精度计算的类。普通的 double 或 float 类型只能精确表示有限的数字,而对于需要高精度计算的场景,BigDeci…

    编程 2025-04-25

发表回复

登录后才能评论