Cześć wszystkim;
Pytanie odnośnie Kubernetesa. Mam okazję pracować z nim od jakiegoś czasu i dzisiaj miałem taką sytuację, że dwie repliki Deployment'u wyłożyły się w dokładnie tej samej sekundzie. Szukałem też przyczyny tego restartu. Niestety z samej aplikacji nie zalogowało mi nic podejrzanego, a describe z podów wyglądał tak: "Reason: Error; Exit Code:1" -.-
Byłem przekonany (być może błędnie), że jak uruchomię więcej niż jedną replikę, to będzie mała szansa, że pod zrestartuje się dokładnie w tym samym czasie, np. w przypadku jakiegoś "nieoczekiwanego błędu wewnętrznego" aplikacji.
W logach jedno znalazłem jeszcze - do zarządzania liczbą replik mam uruchomione HPA, i krótko przed restartem podów HPA rzucił eventy:
Warning | FailedGetResourseMetric | hpa | failed to get cpu utilization: unable to get metrics from resource cpu: metrics returned from resource metrics API
Warning | FailedComputeMetricsReplicas | hpa | invalid metrics (1 invalid out of 1), first error is: unable to get metrics from resource cpu: metrics returned from resource metrics API
Ten błąd metryk może być powodem restartu tych replik?
Jakie macie pomysły?
Dzięki za wypowiedź w temacie.