![](/img/trans.png)
[英]How to let fluentd to collect logs from a container outside of k8s cluster?
[英]Collect logs from Mesos Cluster
我的团队正在Amazon EC2实例上部署新集群。 经过一番研究,我们决定选择Apache Mesos作为群集管理器,使用Spark进行计算。
我们问自己的第一个问题是,对于每个不同的框架,从所有计算机收集日志的最佳方法是什么? 到现在为止,我们开发了一些自定义的bash / python脚本,这些脚本从预定义的位置收集日志,将其压缩并发送到S3。 这种旋转是由每小时执行一次的cron作业激活的。
我一直在寻找实现此目的的“最佳”(或标准)方法。 我找到了Apache Flume ,它也是日志的数据收集器,但我不知道如何将其集成到Mesos群集中以收集日志(并用于Spark)。
我发现了这个 “相似”的问题,但是解决方案不是开源的,也不再受支持。
是否有更好的轮换日志方式或我缺少的标准方式?
非常感谢你
没有完美的答案。 如果您使用的是Spark并且对使用Flume感兴趣,则必须编写一个自定义的Flume-> Spark接口,因为据我所知尚不存在。 但是,您可以执行以下操作:
据推测,Spark Streaming尚未达到黄金时段的生产水平,但这是一种潜在的解决方案。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.