繁体 English 中英

Docker 设计：在容器之间交换数据还是将多个进程放在一个容器中？

[英]Docker design: exchange data between containers or put multiple processes in one container?

原文 2019-03-06 10:50:51 3 2 docker/ architecture

在当前项目中，我必须执行以下任务（除其他外）：

从五个 IP 摄像机捕获视频帧并拼接全景图
在全景图上运行基于机器学习的对象检测
流式传输全景图，以便它可以显示在 UI 中

目前，拼接和流式传输在一个 docker 容器中运行，对象检测在另一个容器中运行，读取全景流作为输入。

由于我需要在保持 UI 的流分辨率的同时增加对象检测器的输入分辨率，因此我必须寻找其他方法来从拼接器容器获取拼接（全分辨率）全景（每帧约 10 MB）到探测器容器。

我对潜在解决方案的看法：

共享卷。 潜在的缺点：每帧额外的一次写入和读取可能太慢了？
使用消息队列或例如 redis。 潜在的缺点：架构中的另一个组件。
合并两个容器。 潜在的缺点：不仅感觉不对，而且两个容器具有完全不同的基础镜像和依赖项。 另外，我不得不担心并行化。

由于我不是 docker 抽屉里最锋利的刀，我所要求的是有关 docker 容器之间快速数据交换的技巧、经验和最佳实践。

2 个解决方案

通常 Docker 容器之间的大多数通信是通过网络套接字进行的。 当您与诸如关系数据库或 HTTP 服务器之类的东西交谈时，这很好。 不过，听起来您的应用程序更多的是关于共享文件，而 Docker 不太擅长这一点。

如果您只想要每个组件的一个副本，或者仍在积极开发管道：我可能不会为此使用 Docker。 由于每个容器都有一个独立的文件系统和自己的用户 ID 空间，因此共享文件可能会出乎意料地棘手（每个容器必须就数字用户 ID 达成一致）。 但是如果你只是在主机上运行所有东西，作为同一个用户，指向同一个目录，这不是问题。

如果你想在生产中扩展它：我会添加某种共享文件系统和一个消息队列系统，比如 RabbitMQ。 对于本地工作，这可能是一个 Docker 命名的卷或绑定安装的主机目录； 像 Amazon S3 这样的云存储也可以正常工作。 设置是这样的：

每个组件都知道共享存储并连接到 RabbitMQ，但不知道其他组件。
每个组件从 RabbitMQ 队列中读取一条消息，该队列命名一个要处理的文件。
该组件读取文件并完成其工作。
完成后，组件将结果文件写回共享存储，并将其位置写入 RabbitMQ 交换。

在这个设置中，每个组件都是完全无状态的。 例如，如果您发现它的机器学习组件最慢，您可以运行它的重复副本。 如果出现问题，RabbitMQ 会记住给定的消息还没有被完全处理（确认）； 再次由于隔离，您可以在本地运行该特定组件以重现和修复问题。

该模型还可以很好地转换为更大规模的基于 Docker 的集群计算系统，如 Kubernetes。

在本地运行它，我绝对会在单独的容器中保留单独的关注点（特别是如果单独的图像处理和 ML 任务很昂贵）。 我建议的设置需要一个消息队列（以跟踪工作）和一个共享文件系统（因为消息队列往往不会针对 10 MB 以上的单个消息进行优化）。 您可以在 Docker 命名卷和主机绑定挂载之间进行选择，作为现成的共享存储。 绑定挂载更容易检查和管理，但在某些平台上速度非常慢。 我认为命名卷相当快，但您只能从 Docker 容器访问它们，这意味着需要启动更多容器来执行备份和修剪等基本操作。

好吧，让我们解开这个：

恕我直言，共享卷工作得很好，但随着时间的推移变得过于混乱。 特别是如果您正在处理有状态服务。
MQ：在我看来，这似乎是最好的选择。 是的，它是您架构中的另一个组件，但拥有它而不是维护凌乱的共享卷或处理大量容器映像（如果您设法组合 2 个容器映像）是有意义的
是的，您可能会这样做，但不是一个好主意。 考虑到您的用例，我将继续假设您有大量可能导致冲突的依赖项。 此外，大量依赖 = 更大的图像 = 更大的攻击面 - 从安全角度来看，这不是一件好事。

如果你真的想在一个容器中运行多个进程，这是可能的。 有多种方法可以实现这一点，但我更喜欢supervisord 。

https://docs.docker.com/config/containers/multi-service_container/

docker容器之间的连接：需要放置网关而不是容器名称，为什么？

[英]Connection between docker containers: need to put gateway instead of name of container, why?

当一个容器旋转另一个时，docker 在容器之间共享数据

[英]docker share data between containers when one spins the other

在多个Docker容器之间使用配置数据共享卷的最佳方法

[英]The best way to share volume with config data between multiple Docker containers

在一个容器或多个容器上运行多个服务Docker？

[英]Multiple services to run on a container or multiple containers Docker?

在容器之间共享Docker容器存储量

[英]Share Docker container storage volume between containers

Docker Container DISALLOW / DISABLE容器之间的通信

[英]Docker Container DISALLOW/DISABLE communication between containers

Docker在容器之间共享数据

[英]Docker Share Data Between Containers

使用docker-compose将多个Docker容器链接到一个别名为localhost的容器

[英]Linking multiple docker containers to one container with alias localhost using docker-compose

一个Docker容器或专用容器中的所有内容

[英]Everything inside one docker container or specialized containers

从Dockerfile在Docker容器中启动多个进程

[英]start multiple processes in docker container from Dockerfile

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 docker容器之间的连接：需要放置网关而不是容器名称，为什么？当一个容器旋转另一个时，docker 在容器之间共享数据在多个Docker容器之间使用配置数据共享卷的最佳方法在一个容器或多个容器上运行多个服务Docker？在容器之间共享Docker容器存储量 Docker Container DISALLOW / DISABLE容器之间的通信 Docker在容器之间共享数据使用docker-compose将多个Docker容器链接到一个别名为localhost的容器一个Docker容器或专用容器中的所有内容从Dockerfile在Docker容器中启动多个进程

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM