繁体   English   中英

如何有效地使用 CompletableFuture 到 map 每个输入的异步任务

[英]How to efficiently use CompletableFuture to map async task per input

我想返回 map,包括所有键到值的映射,即 API 对这些键的响应。 我为此使用CompletableFutureGuava 下面是我的尝试。 是否有任何其他标准方法可以通过 Java 8 和线程 API 实现相同的目标?

Map 是id -> apiResponse(id)

    
    public static List<String> returnAPIResponse(Integer key) {
        return Lists.newArrayList(key.toString() + " Test");
    }

    public static void main(String[] args) {
        List<Integer> keys = Lists.newArrayList(1, 2, 3, 4);

        List<CompletableFuture<SimpleEntry<Integer, List<String>>>> futures = keys
            .stream()
            .map(key -> CompletableFuture.supplyAsync(
                () -> new AbstractMap.SimpleEntry<>(key, returnAPIResponse(key))))
            .collect(Collectors.toList());

        System.out.println(
            futures.parallelStream()
            .map(CompletableFuture::join)
            .collect(Collectors.toList()));

    }

这里有一个有趣的行为,我会尽力解释。 让我们从简单的开始,让我们暂时忘记CompletableFuture并简单地使用普通的parallelStream来执行此操作,并添加了一个小的调试步骤:

List<Integer> keys = Lists.newArrayList(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16);

Map<Integer, List<String>> result =
    keys.parallelStream()
        .map(x -> new AbstractMap.SimpleEntry<>(x, returnAPIResponse(x)))
        .collect(Collectors.toMap(Map.Entry::getKey, Map.Entry::getValue));

System.out.println("parallelism : " + pool.getParallelism() + " current : " + pool.getPoolSize());

在我的机器上,打印:

parallelism : 11 current : 11

我假设您已经知道parallelStream的操作是在commonForkJoinPool中执行的。 output 的含义可能也很明显: 11 threads可用并且全部使用。

我现在将稍微修改您的示例:

List<Integer> keys = Lists.newArrayList(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16);

ForkJoinPool pool = ForkJoinPool.commonPool();
ExecutorService supplyPool = Executors.newFixedThreadPool(2);

Map<Integer, List<String>> result =
keys.parallelStream()
    .map(x -> CompletableFuture.supplyAsync(
             () -> new AbstractMap.SimpleEntry<>(x, returnAPIResponse(x)),
             supplyPool
    ))
    .map(CompletableFuture::join)
    .collect(Collectors.toMap(Map.Entry::getKey, Map.Entry::getValue));

 System.out.println("parallelism : " + pool.getParallelism() + " current : " + pool.getPoolSize());

这实际上只是一个重要的变化,我会让你的supplyAsync在它自己的线程池中运行; rest 是一样的。 运行它,显示:

parallelism : 11 current : 16

惊喜。 创建了更多线程然后我们想要什么? 好吧, getPoolSize的文档说:

返回已启动但尚未终止的工作线程数。 此方法返回的结果可能与 getParallelism 在创建线程以在其他线程被协作阻塞时保持并行性时有所不同。

您的情况下的阻塞是通过map(CompletableFuture::join)发生的。 您已经有效地阻止了来自ForkJoinPool的工作线程,它通过旋转另一个工作线程来弥补这一点。


如果您不想遇到这样的意外:

List<CompletableFuture<AbstractMap.SimpleEntry<Integer, List<String>>>> list =
keys.stream()
    .map(x -> CompletableFuture.supplyAsync(
         () -> new AbstractMap.SimpleEntry<>(x, returnAPIResponse(x)),
         supplyPool
     ))
    .collect(Collectors.toList());

CompletableFuture.allOf(list.toArray(new CompletableFuture[0])).join();

Map<Integer, List<String>> result =
list.stream()
    .map(CompletableFuture::join)
    .collect(Collectors.toMap(Map.Entry::getKey, Map.Entry::getValue));

因为ForJoinPool的工作线程上没有join ,所以您可以删除parallelStream 然后我仍然阻止通过以下方式获得结果:

CompletableFuture.allOf(list.toArray(new CompletableFuture[0])).join();

但不会产生补偿线程。 而且因为CompletableFuture.allOf返回CompletableFuture<Void> ,我需要再次 stream 来获得结果。

不要让最后一个 stream 操作中的.map(CompletableFuture::join)欺骗你,因为之前的CompletableFuture::allOf已经阻塞并等待所有任务完成,所以没有阻塞。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM