GCE — нет метрик памяти стекдрайвера для узлов

Я настроил свой кластер Kubernetes 1.3.4 на GCE с

export KUBE_ENABLE_CLUSTER_MONITORING=google

Это работает довольно хорошо, я получаю журналы приложений (почему-то в разделе Container Engine, но хорошо), а также метрики pod и node.

Единственное, чего не хватает, так это метрики памяти узла, показан только ЦП (см. скриншот)

Нет показателей памяти

В логах heapster я вижу кучу таких строк

{
 metadata: {
  severity: "ERROR"    
  projectId: "<project-id>"    
  serviceName: "container.googleapis.com"    
  zone: "europe-west1-d"    
  labels: {
   container.googleapis.com/cluster_name: "production"     
   compute.googleapis.com/resource_type: "instance"     
   compute.googleapis.com/resource_name: "fluentd-cloud-logging-production-minion-group-p0w8"     
   container.googleapis.com/instance_id: "6772154497331326454"     
   container.googleapis.com/pod_name: "heapster-v1.1.0-2102007506-23b3e"     
   compute.googleapis.com/resource_id: "6772154497331326454"     
   container.googleapis.com/stream: "stderr"     
   container.googleapis.com/namespace_name: "kube-system"     
   container.googleapis.com/container_name: "heapster"     
  }
  timestamp: "2016-09-13T14:40:08.000Z"    
  projectNumber: "930564692351"    
 }
 textPayload: "E0913 14:40:08.665035       1 gcm.go:179] Error while sending request to GCM googleapi: Error 400: Timeseries 76, point: start is not older than end, for a cumulative metric, invalidParameter
"   
 insertId: "pt5bo7g132r266"   
 log: "heapster"   
}

Не уверен, что это связано.

Любые идеи?


person wirtsi    schedule 13.09.2016    source источник
comment
ты когда-нибудь это понял?   -  person habitats    schedule 03.03.2017
comment
Нет, мы перешли на GKE.. там работает   -  person wirtsi    schedule 07.03.2017
comment
На GKE тоже долго не работало - проблема была между stackdriver и heapster, iirc, которая была решена позже - мы часто жаловались на это :/   -  person p_l    schedule 01.10.2017


Ответы (1)


Если вы используете свой кластер с помощью GCE вместо GKE, вам следует установить стековый драйвер агента и проверьте учетные данные, которые агент использует для связи со стеком link

Если вы используете Linux, вы можете установить агент, выполнив:

curl -sSO https://dl.google.com/cloudagents/install-monitoring-agent.sh
sudo bash install-monitoring-agent.sh

и вы можете проверить свои учетные данные, выполнив следующую команду:

sudo cat $GOOGLE_APPLICATION_CREDENTIALS
sudo cat /etc/google/auth/application_default_credentials.json
person miguelfrancisco85    schedule 24.01.2018