繁体 English 中英

ELK Stack的网络容错架构

[英]A network fault-tolerant architecture for ELK Stack

原文 2016-12-31 08:25:34 0 1 architecture/ elastic-stack

我只有几天熟悉ELK Stack 。 我们正在尝试在企业应用程序中使用它，但存在一些体系结构方面的问题。 我已经看过并阅读了ELK及其体系结构的一些用例，尤其是在linkedin中，但是没有人讨论过网络错误对其体系结构的潜在影响。

在通常将日志写入文件的传统应用程序中，可能导致系统崩溃的唯一原因是“ Disk is Full错误，这种情况很少发生。 但是在通过网络发送日志的集中式日志系统中，由于网络错误非常普遍，我认为该系统极易发生崩溃！ 特别是在网络不可靠的部队中。

此外，正如我在许多ELK用例中所看到的那样，将JMS Provider的单个实例，或者换句话说，将Kafka或Redis类的Pub/Sub Provider与ELK一起使用。 我认为除了先前的问题外， JMS Provider还是这些体系结构中的single point of failure ！ 除非，否则将被聚类。

我认为，如果像下面这样在单个节点上与每个Shipper[s]一起使用像Kafka这样的JMS Provider ，则可以摆脱这两个问题（每个节点一个Kafka ）：

((log-generator)+ (logstash)? Kafka)* -> Logstash -> Elasticsearch -> Kibana

请让我知道这种架构是否有意义？
如果没有成功，将欢迎其他任何容错架构:)

1 个解决方案

答案取决于所允许的风险程度，您可能希望在何处遇到此类风险以及事件持续多长时间。

如果写入本地文件，则可以使用Filebeat将文件发送到远程logstash。 如果该logstash（或下游Elasticsearch群集）施加了反压力，则filebeat将减慢速度或停止发送日志。 这为您提供了远程计算机上的分布式缓存（不需要代理）。 不利的一面是，如果中断是长期的，则日志文件可能会从filebeat的glob模式下转出，然后它将永远无法发送。

对于多个logstash实例，您可以配置filebeat以将其发送到它们的列表，从而提供一些生存能力。 如果您有“一次性”事件（例如snmptraps，syslog等），则需要考虑可能的中断。

我曾经为这些类型的事件运行单独的logstash实例，这些实例将馈入redis。 然后，主logtash（启动时）将从队列中读取并处理事件。 这使我可以启动新的logstash配置，而不必担心丢失事件。 这些天来，我尝试将事件写入文件（带有snmptrapd等），而不依赖于任何运行24x7x365的logstash。

您如何设计基于Erlang / OTP的分布式容错多核系统的架构？

[英]How do you design the architecture of an Erlang/OTP-based distributed fault-tolerant multicore system?

容错软件架构

[英]Fault tolerant software architecture

使用Erlang / OTP构建容错的软实时Web应用程序

[英]Building a fault-tolerant soft real-time web application with Erlang/OTP

具有Amazon AWS的单容错机器

[英]Single fault tolerant machine with amazon AWS

使用AWS ECS创建可扩展的容错系统

[英]Creating a scalable and fault tolerant system using AWS ECS

具有容错功能的最佳设计，用于定期调用 API 检索更新

[英]Best design with fault tolerant for retrieving updates periodically invoking an API

堆栈架构扑

[英]Stack architecture flutter

调用堆栈内存架构

[英]Call stack memory architecture

Android架构组件网络线程

[英]Android Architecture Components network threads

设计递归神经网络架构

[英]Designing a recurrent neural network architecture

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 您如何设计基于Erlang / OTP的分布式容错多核系统的架构？容错软件架构使用Erlang / OTP构建容错的软实时Web应用程序具有Amazon AWS的单容错机器使用AWS ECS创建可扩展的容错系统具有容错功能的最佳设计，用于定期调用 API 检索更新堆栈架构扑调用堆栈内存架构 Android架构组件网络线程设计递归神经网络架构

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM