[英]Ceph Mgr not responding to certain commands
我们有一个用 rook 构建的 ceph 集群(2 mgrs, 3 mons, 2 mds each cephfs, 24 osds, rook: 1.9.3, ceph: 16.2.7, kubelet: 1.24.1)。 我们的操作需要不断地创建和删除 cephfilesystems。 加班时我们遇到了 rook-ceph-mgr 的问题。 集群建成后,在一两周内,rook-ceph-mgr 无法响应某些 ceph 命令,如 ceph osd pool autoscale-status、ceph fs subvolumegroup ls,而其他命令(如 ceph -s)运行良好。 我们必须重新启动 rook-ceph-mgr 才能让它运行。 现在我们有大约 30 个 cephfilesystems,而且问题发生得更频繁。
我们尝试禁用管理模块仪表板、prometheus 和 iostat,关闭 ceph 进度,增加 mgr_stats_period 和 mon_mgr_digest_period。 那没有多大帮助。 经过一两个创建和删除周期后,该问题再次发生。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.