Cześć,
wyobraźmy sobie, że mamy usługę X, do którego nasz serwis robi zapytania. Ponieważ nasz serwis przyjmuje duży ruch a usługa X ma limity requestów (http) na sekundę chcemy jakoś "dławić" liczbę zapytań na sekundę. Nasz serwis działa w kilku replikach i limit jest wspólny dla wszystkich replik. Cięzko z góry założyć ile jest replik bo się autoskalują (ale ostatecznie możemy wskazać taką liczbę jeżeli ma to znacznie ułatwić). Nasz serwis jest napisany w Python. I teraz:
- Na upartego wiem jak to zrobić
Pytanie brzmi: jak się takie rzeczy robi prawidłowo?