[英]How do I plot the gPRC error ratio via MQL on a Cumulative duration metric with Opentelemetry data exported to Google Monitoring
我有一个由opentelemetry-operations-go导出的workload.googleapis.com/rpc.server.duration
指标,它是一种累积类型的指标
我如何通过 MQL 计算 plot 的错误率?
我知道我可以 plot 这样的请求率
fetch generic_task
| metric 'workload.googleapis.com/rpc.server.duration'
| count_from
| rate
| group_by [metric.rpc_method, resource.location],
[value_duration_aggregate: sum(value_duration_count_from)]
| every 1m
但是我卡在了如何将 plot 状态为 not OK 的请求比率上?
我这样试过
fetch generic_task
| metric 'workload.googleapis.com/rpc.server.duration'
| count_from
| rate
| filter_ratio_by [metric.rpc_service, resource.location], metric.rpc_grpc_code != 'OK'
| group_by sliding(5m), sum(val())
| condition val() > .05 '10^2.%'
但是绘制的结果似乎与我的预期相去甚远。
谢谢你。
事实证明我已经很接近了,但我需要更改group_by
和fitler_ratio_by
操作之间的顺序。
所以这有效:
fetch generic_task
| metric 'workload.googleapis.com/rpc.server.duration'
| count_from
| rate
| group_by sliding(5m), sum(val())
| filter_ratio_by [metric.rpc_service, resource.location], metric.rpc_grpc_code != 'OK'
| condition val() > .05 '10^2.%'
更多细节可以看这里
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.