Egyetértek bár azt gondolom, hogy az online sportlap és a prohardver közötti párhuzam nem teljesen jó, mert el tudom képzelni, hogy a sportlap 99% fölötti cache hittel dolgozik, miközben a prohardveren elég komoly a felhasználói aktivitás és általuk produkált adatbázis írás.
Hagyjuk már ezt az elég "komoly felhasználói aktivitást"... valószínűleg elfutna egy kis instance-on is.
Ettől függetlenül a mai technikával nem szabadna, hogy ekkora leállást okozzon egy hardverhiba.
Igazából az a probléma, hogy több napos leállást okoz bármilyen hiba.
Az üzemeltetésük valahol 10-15 évvel van lemaradva attól, ahol manapság tart az üzemeltetés... gondolom nincs automation tool használva; a szerver filozófia még a "pet"; a szolgáltatások nincsenek konténerben; nincs azonosítva, hogy mi az immutable, mi az ephemeral és mi a persistent storage; nincs rendes mentés, nincs RPO/RTO, se DRP; és a többi. Egy ilyen problémát a kurrens technológiák egy sárga warning üzenettel jeleznének a monitoring felületen, hogy az egyik szerver köhögött egyet, ez miatt az automatikus drain és poweroff megvolt, a pool többi tagja átvette a feladatait és/vagy a hibrid felhő létrehozott az igények szerint resource halmazt és kell human decision, hogy mi legyen a problémával.
Amúgy én kezdek arra hajlani, hogy beszoptak egy zsarolóvírust és a mentésük is kompromittálódott, mert nem volt rendes mentésük és/vagy nem tudják, hogy kell visszaállni mentésből.