代码之家  ›  专栏  ›  技术社区  ›  night-gold

找不到gke度量工作负载

  •  0
  • night-gold  · 技术社区  · 3 年前

    我发现新的gke metrics工作负载对于测试来自定制端点的prometheus输出来说是一个非常有趣的选项。

    我在1.21.5-gke中配置了我的gke集群。1302在monitoring_配置中使用工作负载,它在集群kube admin命名空间上创建了所有必要的pod。我还有库伯内特斯的podmonitor资源,看起来已经准备好了。

    但当我进入stackdriver metrics explorer时,我似乎看不到其中的指标。我试图进入资源类型“Kubernetes容器”,但找不到任何“workload.googleapis.com/”。它已经运行了一个小时,但我找不到指标。

    有人设法从服务中获取指标吗?

    1 回复  |  直到 3 年前
        1
  •  0
  •   Erhard Czving    3 年前

    是的,我今天刚玩过这个。

    先去看看 gcloud beta container clusters 描述一下,看看您的集群是否认为它也应该收集工作负载指标。您应该在启用的度量组件部分找到“工作负载”。

    gcloud beta container clusters describe example-cluster --zone chosen-zone
    

    如果已启用,请通过 docs 查看在启用过程中遗漏了什么。

        2
  •  0
  •   night-gold    3 年前

    好了,我们终于找到了问题所在。这是pod端口名的一个输入错误,但由于之前所有的工作都正常,我们在添加podmonitor时没有想到要查看它。

    通过对端口名的修复,它似乎可以工作,即使有时会出现故障,但目前它仍然可以工作。