如何从不同服务器收集日志到中央服务器（Elasticsearch 和 kibana）

Question

我被分配了创建中央日志服务器的任务。 就我而言，分布着许多 Web 应用程序服务器。 我的任务是从这些不同的服务器获取日志并在将有elastic-search和kibana中央服务器中进行管理。

题

是否可以从具有不同公共 IP 的服务器获取日志？ 如果可能怎么办？
中央服务器需要多少资源（CPU、内存、存储）。

看到的东西

查看示例设置，其中所有日志和应用程序仅在同一台机器上。

寻找通过公共 IP 将日志发送到弹性搜索的方法。

Answer 1

我想与 Ishara 的回答不同。 您可以将日志直接从 filebeat 发送到 elasticsearch，而无需使用 logstash，如果您的日志是通用类型（系统日志、nginx 日志、apache 日志），则使用这种方法您不需要花费额外的成本和维护日志作为 filebeat提供内置的解析处理器。

如果你的服务器上有基于 debian 的操作系统，我已经准备了一个 shell 脚本来安装和配置 filebeat。 您需要根据要配置的模块更改 elasticsearch 服务器 URL 并修改倒数第二行。

关于您的第一个问题，是的，您可以在每个服务器上运行 filebeat 代理并发送数据以集中 Elasticsearch。 对于您的第二个问题，这取决于弹性搜索服务器将要处理和存储的日志量。 它还取决于 kibana 的托管位置。

sudo wget -qO - https://artifacts.elastic.co/GPG-KEY-elasticsearch | sudo apt-key add -

sudo echo "deb https://artifacts.elastic.co/packages/7.x/apt stable main" | sudo tee -a /etc/apt/sources.list.d/elastic-7.x.list

sudo apt-get update && sudo apt-get install -y filebeat

sudo systemctl enable filebeat

sudo bash -c  "cat >/etc/filebeat/filebeat.yml" <<FBEOL
filebeat.inputs:

filebeat.config.modules:
  path: ${path.config}/modules.d/*.yml
  reload.enabled: false

setup.template.name: "filebeat-system"
setup.template.pattern: "filebeat-system-*"
setup.template.settings:
  index.number_of_shards: 1

setup.ilm.enabled: false

setup.kibana:

output.elasticsearch:
  hosts: ["10.32.66.55:9200", "10.32.67.152:9200", "10.32.66.243:9200"]
  indices:
    - index: "filebeat-system-%{+yyyy.MM.dd}"
      when.equals:
        event.module: system

processors:
  - add_host_metadata: ~
  - add_cloud_metadata: ~
  - add_docker_metadata: ~
  - add_kubernetes_metadata: ~

logging.level: warning

FBEOL

sudo filebeat modules enable system
sudo systemctl restart filebeat

Answer 2

是的，可以从具有不同公共 IP 的服务器获取日志。 您需要为每个生成日志的服务器设置一个像filebeat （由 elastic 提供）这样的代理。
- 您需要在每台机器上设置filebeat实例。

它会在每台机器上监听你的日志文件，并将它们转发到你在filebeat.yml配置文件中提到的 logstash 实例，如下所示：

#=========================== Filebeat inputs =============================

filebeat.inputs:

- type: log

  # Change to true to enable this input configuration.
  enabled: true

  # Paths that should be crawled and fetched. Glob based paths.
  paths:
    - /path_to_your_log_1/ELK/your_log1.log
    - /path_to_your_log_2/ELK/your_log2.log

#----------------------------- Logstash output --------------------------------
output.logstash:
  # The Logstash hosts
  hosts: ["private_ip_of_logstash_server:5044"]

Logstash 服务器侦听端口 5044 并通过 logstash 配置文件流式传输所有日志：

 input { beats { port => 5044 } } filter { # your log filtering logic is here } output { elasticsearch { hosts => [ "elasticcsearch_server_private_ip:9200" ] index => "your_idex_name" } }

在 logstash 中，您可以过滤日志并将其拆分为字段并将它们发送到 elasticsearch。
1. 资源取决于您生成的数据量、数据保留计划、TPS 和您的自定义要求。 如果您能提供更多详细信息，我将能够提供有关资源需求的粗略想法。

如何从不同服务器收集日志到中央服务器（Elasticsearch 和 kibana）

问题描述

2 个解决方案

解决方案1
3 2020-02-01 12:34:27

解决方案2
2 已采纳 2020-01-28 09:28:45

如何从不同服务器收集日志到中央服务器（Elasticsearch 和 kibana）

问题描述

2 个解决方案

解决方案1 3 2020-02-01 12:34:27

解决方案2 2 已采纳 2020-01-28 09:28:45

解决方案1
3 2020-02-01 12:34:27

解决方案2
2 已采纳 2020-01-28 09:28:45