[英]Strange behavior of Stream.spliterator for parallel streams
我正在使用流分裂器直接用于我正在编写的库中的低级操作。 最近,当我使用流分裂器和交错tryAdvance/trySplit
调用时,我发现了非常奇怪的行为。 这是一个简单的代码,演示了这个问题:
import java.util.Arrays;
import java.util.Spliterator;
public class SpliteratorBug {
public static void main(String[] args) {
Integer[][] input = { { 1 }, { 2, 3 }, { 4, 5, 6 }, { 7, 8 }, { 9 } };
Spliterator<Integer> spliterator = Arrays.stream(input).parallel()
.flatMap(Arrays::stream).spliterator();
spliterator.trySplit();
spliterator.tryAdvance(s -> {});
spliterator.trySplit();
spliterator.forEachRemaining(System.out::println);
}
}
输出是
5
6
9
正如您所看到的,在平面映射之后,我应该得到从1
到9
的连续数字的有序流。 我将分裂器分开一次,所以它应该跳到一些中间位置。 接下来我从中消耗一个元素并将其拆分一次。 之后我打印所有剩余的元素。 我希望我将从流尾部有几个连续的元素(可能是零元素,它也会很好)。 然而我得到的是5
和6
,然后突然跳到9
。
我知道目前在JDK分裂器中并没有这样使用:它们总是在遍历之前分裂。 但是官方文档没有明确禁止在trySplit
之后调用tryAdvance
。
当我使用直接从集合,数组,生成的源等创建的spliterator时,从未观察到这个问题。只有当spliterator是从具有中间flatMap
的并行流创建时才会观察到。
所以问题是:我是否遇到了这个错误,或者明确禁止某个地方以这种方式使用分裂器?
此方法可能由于任何原因返回
null
,包括空闲, 在遍历开始后无法拆分 ,数据结构约束和效率考虑。
(强调我的)
因此,文档明确提到在开始遍历后尝试拆分的可能性,并建议无法处理此问题的分裂器可能返回null
。
因此对于有序的分裂器,观察到的行为应该被认为是Misha所描述的错误。 通常, trySplit()
必须返回前缀 spliterator的事实,换句话说,必须将关于下一个项目的所有中间状态移交给新的spliterator,这是Spliterator
API的一个特性,它可能会产生错误。 我把这个问题作为检查我自己的spliterator实现的动机,发现了类似的bug ...
从我从AbstractWrappingSpliterator
和公司的源代码中可以看出,当你tryAdvance
, flatMap
(4,5,6)的输出被缓冲,然后4被消耗,留下(5,6)在缓冲区中。 然后trySplit
正确分割(7,8)到新的Spliterator
,在旧的Spliterator
留下9,但缓冲的(5,6)留在旧的Spliterator
。
所以这看起来像是一个错误。 它应该将缓冲区关闭到新的Spliterator
或返回null
并且如果缓冲区不为空则拒绝拆分。
这种行为被正式认定为一个错误(参见JDK-8148838 ),由我修复并推入JDK-9 trunk(参见changeset )。 令人遗憾的是,我的初始补丁实际上修复了flatMap
之后的拆分(请参阅webrev ),但是这个补丁被拒绝了,因为这种情况(在trySplit()
之后使用tryAdvance()
)被认为是不常见tryAdvance()
鼓励。 当前接受的解决方案是在完全提前后禁用WrappingSpliterator
拆分,这足以解决问题。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.