Java8其他新特性之Stream_API


  

引言:

Java8中有两大最为重要的改变。一个是Lambda表达式;另一个则是Stream API。

一、Stream API 说明

  1. Stream API ( java.util.stream) 把真正的函数式编程风格引入到Java中。这是目前为止对Java类库最好的补充,因为Stream API可以极大提供Java程序员的生产力,让程序员写出高效率、干净、简洁的代码。
  2. Stream 是 Java8 中处理集合的关键抽象概念,它可以指定你希望对集合进行的操作,可以执行非常复杂的查找、过滤和映射数据等操作。 使用Stream API 对集合数据进行操作,就类似于使用 SQL 执行的数据库查询。也可以使用 Stream API 来并行执行操作。简言之,Stream API 提供了一种高效且易于使用的处理数据的方式
  3. 实际开发中,项目中多数数据源都来自于Mysql,Oracle等。但现在数据源可以更多了,有MongDB,Radis等,而这些NoSQL的数据就需要Java层面去处理。
  4. Stream 和 Collection 集合的区别:Collection 是一种静态的内存数据结构,而 Stream 是有关计算的。前者是主要面向内存,存储在内存中,后者主要是面向 CPU,通过 CPU 实现计算。
  5. Stream 是数据渠道,用于操作数据源(集合、数组等)所生成的元素序列。“集合讲的是数据,Stream讲的是计算!”

    注意:

    • Stream 自己不会存储元素
    • Stream 不会改变源对象。相反,他们会返回一个持有结果的新Stream
    • Stream 操作是延迟执行的。这意味着他们会等到需要结果的时候才执行

二、Stream 操作步骤

  1. 创建 Stream

    一个数据源(如:集合,数组),获取一个流

  2. 中间操作

    一个中间操作链,对数据源的数据进行处理

  3. 终止操作

    一旦执行终止操作,就执行中间操作链,并产生结果。之后,不会再被利用

三、创建 Stream

1、通过集合

Java8 中的 Collection 接口被扩展,提供了两个获取流的方法:

  • default Stream<E> stream():返回一个顺序流
  • default Stream<E> parallelStream():返回一个并行流

2、通过数组

Java8 中的 Arrays 的静态方法 stream() 可以获取数组流:

  • static <T> Stream<T> stream(T[] array):返回一个流

重载形式,能够处理对应基本类型的数组:

  • public static IntStream stream(int[] array)
  • public static LongStream stream(long[] array)
  • public static DoubleStream stream(double[] array)

3、通过Stream的of

可以调用Stream类静态方法 of(), 通过显示值创建一个流。它可以接收任意数量的参数。

  • public static<T> Stream<T> of(T… values):返回一个流

4、创建无限流

可以使用静态方法 Stream.iterate() 和 Stream.generate(),创建无限流。

迭代:

public static<T> Stream<T> iterate(final T seed, final UnaryOperator<T> f)

生成:

public static<T> Stream<T> generate(Supplier<T> s)

public class Employee {

	private int id;
	private String name;
	private int age;
	private double salary;

	public int getId() {
		return id;
	}

	public void setId(int id) {
		this.id = id;
	}

	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}

	public int getAge() {
		return age;
	}

	public void setAge(int age) {
		this.age = age;
	}

	public double getSalary() {
		return salary;
	}

	public void setSalary(double salary) {
		this.salary = salary;
	}

	public Employee() {
		System.out.println("Employee().....");
	}

	public Employee(int id) {
		this.id = id;
		System.out.println("Employee(int id).....");
	}

	public Employee(int id, String name) {
		this.id = id;
		this.name = name;
	}

	public Employee(int id, String name, int age, double salary) {

		this.id = id;
		this.name = name;
		this.age = age;
		this.salary = salary;
	}

	@Override
	public String toString() {
		return "Employee{" + "id=" + id + ", name='" + name + '\'' + ", age=" + age + ", salary=" + salary + '}';
	}

	@Override
	public boolean equals(Object o) {
		if (this == o)
			return true;
		if (o == null || getClass() != o.getClass())
			return false;

		Employee employee = (Employee) o;

		if (id != employee.id)
			return false;
		if (age != employee.age)
			return false;
		if (Double.compare(employee.salary, salary) != 0)
			return false;
		return name != null ? name.equals(employee.name) : employee.name == null;
	}

	@Override
	public int hashCode() {
		int result;
		long temp;
		result = id;
		result = 31 * result + (name != null ? name.hashCode() : 0);
		result = 31 * result + age;
		temp = Double.doubleToLongBits(salary);
		result = 31 * result + (int) (temp ^ (temp >>> 32));
		return result;
	}
}

class EmployeeData {
	public static List<Employee> getEmployees(){
		List<Employee> list = new ArrayList<>();
		list.add(new Employee(1001, "马化腾", 34, 6000.38));
		list.add(new Employee(1002, "马云", 12, 9876.12));
		list.add(new Employee(1003, "刘强东", 33, 3000.82));
		list.add(new Employee(1004, "雷军", 26, 7657.37));
		list.add(new Employee(1005, "李彦宏", 65, 5555.32));
		list.add(new Employee(1006, "比尔盖茨", 42, 9500.43));
		list.add(new Employee(1007, "任正非", 26, 4333.32));
		list.add(new Employee(1008, "扎克伯格", 35, 2500.32));
		return list;
	}
}
public class StreamAPITest {
    /* 创建Stream方式一:通过集合 */
    @Test
    public void test1() {
        List<Employee> employees = EmployeeData.getEmployees();

        //default Stream<E> stream(): 返回一个顺序流
        Stream<Employee> stream = employees.stream();

        //default Stream<E> parallelStream(): 返回一个并行流
        Stream<Employee> pa = employees.parallelStream();
    }

    /* 创建Stream方式二:通过数组 */
    @Test
    public void test2() {
        int[] arr1 = new int[]{1, 2, 3, 4, 5, 6};
        //调用Arrays类的static <T> Stream<T> stream(T[] array): 返回一个流
        IntStream stream1 = Arrays.stream(arr1);

        Employee e1 = new Employee(1001, "Tom");
        Employee e2 = new Employee(1002, "Jerry");
        Employee[] arr2 = {e1, e2};
        Stream<Employee> stream2 = Arrays.stream(arr2);
    }

    /* 创建Stream方式三:通过Stream的of() */
    @Test
    public void test3() {
        Stream<Integer> stream = Stream.of(1, 2, 3, 4, 5, 6);
    }

    /* 创建Stream方式四:通过无限流 */
    @Test
    public void test4() {
        /** 迭代
         * public static<T> Stream<T> iterate(final T seed, final UnaryOperator<T> f)
         */
        //遍历前10个偶数
        Stream.iterate(0, t -> t + 2).limit(10).forEach(i -> System.out.println(i));
        Stream.iterate(0, t -> t + 2).limit(12).forEach(System.out::println);

        /** 生成
         * public static<T> Stream<T> generate(Supplier<T> s)
         */
        Stream.generate(Math::random).limit(10).forEach(System.out::println);
    }
}

四、Stream 的中间操作

  多个中间操作可以连接起来形成一个流水线,除非流水线上触发终止操作,否则中间操作不会执行任何的处理!而在终止操作时一次性全部处理,称为“惰性求值”

1、筛选与切片

方法 描述
filter(Predicate p) 接受 Lambda,从流中排出某些元素
distinct() 筛选,通过流所生成元素的 hashCode() 和 equals() 去除重复元素
limit(long maxSize) 截断流,使其元素不超过给定数量
skip(long n) 跳过元素,返回一个扔掉了前 n 个元素的流。若流中元素不足 n 个,则返回一个空流。与 limit(n) 互补
@Test
public void test1() {
    List<Employee> list = EmployeeData.getEmployees();

    // filter(Predicate p) —— 接收 Lambda,从流中排除某些元素。
    Stream<Employee> stream = list.stream();
    stream.filter(e -> e.getSalary() > 7000).forEach(System.out::println);
    System.out.println();

    // limit(n) —— 截断流,使其元素不超过给定数量。
    list.stream().limit(3).forEach(e -> System.out.println(e));
    System.out.println();

    // skip(n) —— 跳过元素,返回一个扔掉了前 n 个元素的流。若流中元素不足 n 个,则返回一个空流。与 limit(n) 互补
    list.stream().skip(3).forEach(System.out::println);
    System.out.println();

    // distinct() —— 筛选,通过流所生成元素的 hashCode() 和 equals() 去除重复元素
    list.add(new Employee(1010,"刘强东",40,8000));
    list.add(new Employee(1010,"刘强东",41,8000));
    list.add(new Employee(1010,"刘强东",40,8000));
    list.stream().distinct().forEach(System.out::println);
}

2、映射

方法 描述
map(Function<T, R> f) 接收一个函数作为参数,该函数会被应用到每个元素上,并将其映射成一个新的R类型的元素,形成一个新的流Stream<R>。
mapToInt(ToIntFunction<T> f) 接收一个函数作为参数,该函数会被应用到每个元素上,并将其映射成一个新的int元素,产生一个新的 IntStream。
mapToLong(ToLongFunction<T> f) 接收一个函数作为参数,该函数会被应用到每个元素上,并将其映射成一个新的long元素,产生一个新的 LongStream。
mapToDouble(ToDoubleFunction<T> f) 接收一个函数作为参数,该函数会被应用到每个元素上,并将其映射成一个新的double元素,产生一个新的 DoubleStream。
flatMap(Function<T, Stream<R>> f) 接收一个函数作为参数,将流中的每个值都换成另一个流Stream<R>,然后把所有流连接成一个流Stream<R>。
flatMapToInt(Function<T, IntStream> f) 接收一个函数作为参数,将流中的每个值都换成另一个IntStream,然后把所有IntStream连成一个IntStream。
flatMapToLong(Function<T, LongStream> f) 接收一个函数作为参数,将流中的每个值都换成另一个LongStream,然后把所有LongStream连成一个LongStream。
flatMapToDouble(Function<T, DoublStream> f) 接收一个函数作为参数,将流中的每个值都换成另一个DoublStream,然后把所有DoublStream连成一个DoublStream。
public class StreamAPITest {
    @Test /* 映射 */
    public void test2() {
        // map(Function f) —— 接收一个函数作为参数,将元素转换成其他形式或提取信息,该函数会被应用到每个元素上,并将其映射成一个新的元素。
        List<String> list = Arrays.asList("aa", "bb", "cc", "dd");
        list.stream().map(str -> str.toUpperCase()).forEach(System.out::println);
        System.out.println();

        // 练习1:获取员工姓名长度大于3的员工的姓名。
        List<Employee> employees = EmployeeData.getEmployees();
        Stream<String> nameStream = employees.stream().map(Employee::getName);
        nameStream.filter(name -> name.length() > 3).forEach(System.out::println);
        System.out.println();

        // 练习2:
        Stream<Stream<Character>> streamStream = list.stream().map(StreamAPITest::fromStringToStream);
        streamStream.forEach(s ->{s.forEach(System.out::println);});//两层遍历

        // flatMap(Function f) —— 接收一个函数作为参数,将流中的每个值都换成另一个流,然后把所有流连接成一个流。
        Stream<Character> characterStream = list.stream().flatMap(StreamAPITest::fromStringToStream);
        characterStream.forEach(System.out::println);//一层遍历
    }

    //将字符串中的多个字符构成的集合转换为对应的Stream的实例
    public static Stream<Character> fromStringToStream(String str){
        ArrayList<Character> list = new ArrayList<>();
        for(Character c : str.toCharArray()){
            list.add(c);
        }
        return list.stream();
    }
}

3、排序

方法 描述
sorted() 产生一个新流,其中按自然顺序排序
sorted(Comparator com) 产生一个新流,其中按比较器顺序排序
@Test /* 排序 */
public void test4() {
    // sorted() —— 自然排序
    List<Integer> list = Arrays.asList(12, 43, 65, 34, 87, 0, -98, 7);
    list.stream().sorted().forEach(System.out::println);

    // sorted(Comparator com) —— 定制排序
    List<Employee> employees = EmployeeData.getEmployees();
    employees.stream().sorted((e1, e2) -> {
        int ageValue = Integer.compare(e1.getAge(), e2.getAge());
        if (ageValue == 0) {
            return -Double.compare(e1.getSalary(), e2.getSalary());
        }
        return ageValue;
    }).forEach(System.out::println);
}

五、Stream 的终止操作

  终端操作会从流的流水线生成结果。其结果可以是任何不是流的值,例如:List、Integer,甚至是 void 。流进行了终止操作后,不能再次使用

1、匹配与查找

方法 描述
allMatch(Predicate<T> p) 检查是否匹配所有元素
anyMatch(Predicate<T> p) 检查是否至少匹配一个元素
noneMatch(Predicate<T> p) 检查是否没有匹配所有元素
findFirst() 返回第一个元素
findAny() 返回当前流中的任意元素
count() 返回流中元素总数
max(Comparator<T> c) 返回流中最大值
min(Comparator<T> c) 返回流中最小值
forEach(Consumer<T> c) 内部迭代(使用 Collection 接口需要用户去做迭代,称为外部迭代。相反,Stream API 使用内部迭代——它帮你把迭代做了) 。当Stream为parallel的时候,它是并行处理多线程的,所以不能保证输出数据的顺序,但是处理数据的效率比较高
forEachOrdered(Consumer<T> c) 当Stream 为parallel的时候,虽然是多个线程并行处理的。但是还是会按照他原有的顺序输出的,底层是通过happensbefore原则保证了它的内存可见性

2、规约

方法 描述
reduce(T iden, BinaryOperator<T> b) 可以将流中元素反复结合起来,得到一个值。返回 T
reduce(BinaryOperator<T> b) 可以将流中元素反复结合起来,得到一个值。返回 Optional<T>
reduce(U iden, BiFunction<U, T, U> f, BinaryOperator<U> b) 可以将流中元素反复结合起来,得到一个值。返回 U

3、收集

方法 描述
<R, A> R collect(Collector<T, A, R> c) 将流转换为其他形式。接收一个 Collector<T, A, R>接口的实现,用于给Stream中元素做汇总的方法

  Collector<T, A, R> 接口中方法的实现决定了如何对流执行收集的操作(如收集到 List、Set、Map)。另外, Collectors 实用类提供了很多静态方法,可以方便地创建常见收集器实例,具体方法与实例如下表:

方法 最终的收集类型 作用
toList() List<T> 把流中元素收集到List
toSet() Set<T> 把流中的元素收集到Set
toCollection(Supplier<C> factory) Collection<T> 把流中的元素收集到创建的集合
counting() Long 计算流中元素个数
summingInt(ToIntFunction<T> mapper) Integer 返回一个收集器,该收集可以将流中的每个T类型的元素通过ToIntFunction转换成int后,进行求和
summingLong(ToLongFunction<T> mapper) Long 返回一个收集器,该收集可以将流中的每个T类型的元素通过ToLongFunction转换成long后,进行求和
summingDouble(ToDoubleFunction<T> mapper) Double 返回一个收集器,该收集可以将流中的每个T类型的元素通过ToDoubleFunction&lt转换成double后,进行求和
averagingInt(ToIntFunction<T> mapper) Integer 返回一个收集器,该收集可以将流中的每个T类型的元素通过ToIntFunction转换成int后,求取转换后元素的算术平均值
averagingLongt(ToLongFunction<T> mapper) Long 返回一个收集器,该收集可以将流中的每个T类型的元素通过ToLongFunction转换成long后,求取转换后元素的算术平均值
averagingDoublet(ToDoubleFunction<T> mapper) Double 返回一个收集器,该收集可以将流中的每个T类型的元素通过ToDoubleFunction转换成double后,求取转换后元素的算术平均值
summarizingInt(ToIntFunction<T> mapper) IntSummaryStatistics 该收集器对流中每个T类型的元素应用生成int的映射函数,并返回结果值的汇总统计信息。如:平均值、和、个数、最大值、最小值等
summarizingLong(ToLongFunction<T> mapper) IntSummaryStatistics 该收集器对流中每个T类型的元素应用生成long的映射函数,并返回结果值的汇总统计信息。如:平均值、和、个数、最大值、最小值等
summarizingDouble(ToDoubleFunction<T> mapper) IntSummaryStatistics 该收集器对流中每个T类型的元素应用生成double的映射函数,并返回结果值的汇总统计信息。如:平均值、和、个数、最大值、最小值等
joining() String 连接流中每个字符串
joining(CharSequence delimiter) String 按指定分隔符delimiter,连接流中每个字符串
joining(CharSequence delimiter, CharSequence prefix, CharSequence suffix) String 按指定分隔符delimiter,以及指定前后缀,连接流中每个字符串
maxBy(Comparator<T> c) Optional<T> 根据比较器选择最大值
minBy(Comparator<T> c) Optional<T> 根据比较器选择最小值
reducing(BinaryOperator<T> op) Optional<T> 从一个作为累加器的初始值开始,利用BinaryOperator与流中元素逐个结合,从而归约成单个值
collectingAndThen(Collector<T,A,R> downstream, Function<R,RR> finisher) 转换函数返回的类型RR 包裹一个收集器,并对其结果进行转换。在收集后执行附加的转换操作
groupingBy(Function<T,K> classifier) Map<K, List<T>> 根据分类函数classifier的返回值进行分组。利用此可以根据某属性值对流分组,属性为K,结果为V
partitioningBy(Predicate<T> p) Map<Boolean, List<T>> 根据true或false进行分区
public class StreamAPITest {
    /* 1-匹配与查找 */
    @Test
    public void test1(){
        List<Employee> employees = EmployeeData.getEmployees();

        // allMatch(Predicate p) —— 检查是否匹配所有元素。
        /*练习:是否所有的员工的年龄都大于18*/
        boolean allMatch = employees.stream().allMatch(e -> e.getAge() > 18);
        System.out.println(allMatch);

        // anyMatch(Predicate p) —— 检查是否至少匹配一个元素。
        /*练习:是否存在员工的工资大于 10000*/
        boolean anyMatch = employees.stream().anyMatch(e -> e.getSalary() > 10000);
        System.out.println(anyMatch);

        // noneMatch(Predicate p) —— 检查是否没有匹配的元素。
        /*练习:是否存在员工姓“雷”*/
        boolean noneMatch = employees.stream().noneMatch(e -> e.getName().startsWith("雷"));
        System.out.println(noneMatch);

        // findFirst —— 返回第一个元素
        Optional<Employee> employee = employees.stream().findFirst();
        System.out.println(employee);

        // findAny —— 返回当前流中的任意元素
        Optional<Employee> employee1 = employees.parallelStream().findAny();
        System.out.println(employee1);
    }

    @Test
    public void test2(){
        List<Employee> employees = EmployeeData.getEmployees();

        // count —— 返回流中元素的总个数
        long count = employees.stream().filter(e -> e.getSalary() > 5000).count();
        System.out.println(count);

        // max(Comparator c) —— 返回流中最大值
        /*练习:返回最高的工资:*/
        Stream<Double> salaryStream = employees.stream().map(e -> e.getSalary());
        Optional<Double> maxSalary = salaryStream.max(Double::compare);
        System.out.println(maxSalary);

        // min(Comparator c) —— 返回流中最小值
        /*练习:返回最低工资的员工*/
        Optional<Employee> employee = employees.stream().min((e1, e2) -> Double.compare(e1.getSalary(), e2.getSalary()));
        System.out.println(employee);
        System.out.println();

        // forEach(Consumer c) —— 内部迭代
        employees.stream().forEach(System.out::println);

        // 使用集合的遍历操作
        employees.forEach(System.out::println);
    }

    /* 2-归约 */
    @Test
    public void test3(){
        // reduce(T identity, BinaryOperator op) —— 可以将流中元素反复结合起来,得到一个值。返回 T
        /*练习1:计算1-10的自然数的和*/
        List<Integer> list = Arrays.asList(1,2,3,4,5,6,7,8,9,10);
        Integer sum = list.stream().reduce(0, Integer::sum);
        System.out.println(sum);

        // reduce(BinaryOperator op) —— 可以将流中元素反复结合起来,得到一个值。返回 Optional<T>
        /*练习2:计算公司所有员工工资的总和*/
        List<Employee> employees = EmployeeData.getEmployees();
        Stream<Double> salaryStream = employees.stream().map(Employee::getSalary);
        //Optional<Double> sumMoney = salaryStream.reduce(Double::sum);
        Optional<Double> sumMoney = salaryStream.reduce((d1, d2) -> d1 + d2);
        System.out.println(sumMoney.get());

    }

    /* 3-收集 */
    @Test
    public void test4(){
        // collect(Collector c) —— 将流转换为其他形式。接收一个 Collector接口的实现,用于给Stream中元素做汇总的方法
        /*练习1:查找工资大于6000的员工,结果返回为一个List或Set*/
        List<Employee> employees = EmployeeData.getEmployees();
        List<Employee> employeeList = employees.stream().filter(e -> e.getSalary() > 6000).collect(Collectors.toList());
        employeeList.forEach(System.out::println);
        System.out.println();

        Set<Employee> employeeSet = employees.stream().filter(e -> e.getSalary() > 6000).collect(Collectors.toSet());
        employeeSet.forEach(System.out::println);
    }
}

文章作者: YangChongZhi
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 YangChongZhi !
评论
 上一篇
Java8其他新特性之Optional类 Java8其他新特性之Optional类
   引言: 空指针异常是导致Java应用程序失败的最常见原因。以前,为了解决空指针异常,Google公司著名的Guava项目引入了Optional类,Guava通过使用检查空值的方式来防止代码污染,它鼓励程序员写更干净的代码。受到Goog
2021-01-20
下一篇 
Java8其他新特性之Lambda表达式 Java8其他新特性之Lambda表达式
   引言: Java 8 (又称为 jdk 1.8) 是 Java 语言开发的一个主要版本。Java 8 是oracle公司于2014年3月发布,可以看成是自Java 5 以来最具革命性的版本。Java 8为Java语言、编译器、类库、开
2021-01-19
  目录