使用 AWS SDK 将 InputStream 异步（非阻塞）上传到 AWS s3，用于 Java，版本 2

Question

当我将inputStream object 同步（阻塞方式）上传到 s3 时，它可以工作。

S3Client s3Client = S3Client.builder().build();
s3Client.putObject(objectRequest, RequestBody.fromInputStream(inputStream,STREAM_SIZE));

但是当我对AsyncRequestBody进行相同尝试时， S3AsyncClient上没有.fromInputStream方法。

S3AsyncClient s3AsyncClient = S3AsyncClient.builder().build();
s3AsyncClient.putObject(objectRequest, AsyncRequestBody.fromInputStream(inputStream,STREAM_SIZE)); // error no method named 'fromInputStream'

而且我不能使用.fromByteBuffer ，因为它会将整个 stream 加载到 memory 中，这是我不想要的。

我很感兴趣，为什么没有从AsyncRequestBody中的 InputStream 读取的方法。 还有其他选择吗？

Answer 1

对于使用 Kotlin 和协程的任何人：这是一个 kotlin 包装器，它将从InputStream创建一个异步AsyncRequestBody 。 默认情况下，包装器将在后台线程中运行，但您可以传递显式CoroutineScope并在协程内部运行它，这将避免创建单独的线程。

import io.ktor.util.cio.*
import kotlinx.coroutines.CoroutineScope
import kotlinx.coroutines.DelicateCoroutinesApi
import kotlinx.coroutines.GlobalScope
import kotlinx.coroutines.launch
import org.reactivestreams.Subscriber
import org.reactivestreams.Subscription
import software.amazon.awssdk.core.async.AsyncRequestBody
import java.io.InputStream
import java.nio.ByteBuffer
import java.util.*

@OptIn(DelicateCoroutinesApi::class)
class StreamAsyncRequestBody(
  inputStream: InputStream,
  private val coroutineScope: CoroutineScope = GlobalScope
) :
  AsyncRequestBody {
  private val inputChannel =
    inputStream.toByteReadChannel(context = coroutineScope.coroutineContext)

  override fun subscribe(subscriber: Subscriber<in ByteBuffer>) {
    subscriber.onSubscribe(object : Subscription {
      private var done: Boolean = false

      override fun request(n: Long) {
        if (!done) {
          if (inputChannel.isClosedForRead) {
            complete()
          } else {
            coroutineScope.launch {
              inputChannel.read {
                subscriber.onNext(it)
                if (inputChannel.isClosedForRead) {
                  complete()
                }
              }
            }
          }
        }
      }

      private fun complete() {
        subscriber.onComplete()
        synchronized(this) {
          done = true
        }
      }

      override fun cancel() {
        synchronized(this) {
          done = true
        }
      }
    })
  }

  override fun contentLength(): Optional<Long> = Optional.empty()
}

示例用法：

suspend fun s3Put(objectRequest: PutObjectRequest, inputStream: InputStream) = coroutineContext {
  s3Client.putObject(objectRequest, StreamAsyncRequestBody(inputStream, this)
}

如果您使用 Java，您将需要创建自己的包装器并使用不同的协程库。 或者，您可以创建一个具有固定数量线程的Executor ：如果您一次运行的上传太多，它们会相互阻塞，但它们不会创建太多线程并阻塞整个程序。

编辑：修复了代码。 我没有测试之前的版本，我测试了这个版本几次上传，它可以工作。 当然，这并不意味着它没有错误:)

Answer 2

经过一番研究，这是我发现的：

InputStream 本质上是阻塞的，因此当您从输入 stream 读取时，某些线程将被阻塞，如果@jakobeha 的回答“ toByteReadChannel ”将返回读取阻塞通道。 所以考虑到性能，它有点相当于在后台线程中执行同步 S3Client.fromInputStream()，你可以通过将它包装在 CompletableFuture 中来做到这一点。
其他“AsyncRequestBody”类型如“FileAsyncRequestBody”使用带有回调的“nio”（非阻塞 I/O）。 也许这就是为什么 AWS 团队没有在“AsyncRequestBody”中包含“fromInputStream”的原因，因为它根本不可能使用完全非阻塞的方式，并且会引起混乱。
如果您想要一个高度可扩展的解决方案，最好的解决方案是不要一起使用 InputStream，找到 InputStream 的来源并使用一些支持非阻塞通道的替代方案，在我的情况下，我使用了 Java Flow 并将其转换为'Publisher ' 并使用 AsyncRequestBody.fromPublisher()

使用 AWS SDK 将 InputStream 异步（非阻塞）上传到 AWS s3，用于 Java，版本 2

问题描述

2 个解决方案

解决方案1
1 已采纳 2021-05-20 19:26:18

解决方案2
1 2021-06-07 11:37:42

使用 AWS SDK 将 InputStream 异步（非阻塞）上传到 AWS s3，用于 Java，版本 2

问题描述

2 个解决方案

解决方案1 1 已采纳 2021-05-20 19:26:18

解决方案2 1 2021-06-07 11:37:42

解决方案1
1 已采纳 2021-05-20 19:26:18

解决方案2
1 2021-06-07 11:37:42