Hali!
Erre a problémára találták ki az orchestrator rendszereket, mint kubernetes,dc/os. Van olyan funkciójuk, hogy figyelik az adott service-t és ha az látszik hogy behalt akkor képesek újraindítani és le/fől skálázni terhelés függyvényében. Valamint van beépitett központi monitoring funkciójuk is plussz még telepíthetők hozzá 3rd party toolok is amivel lehet bőviteni a tudásukat.
Üdv,