( _Franko_ | 2020. 09. 22., k – 10:34 )

méghozzá egy _stabilan_ de hiányosan dokumentált rendszer működését vágja haza

Nem, nem stabil, hanem erősen instabil, de éppen labilis egyensúlyi helyzetben van. A működését nem az vágja haza, hogy ha kicsit is meglököd, akkor felborul, az csak megmutatja a rendszer létező gyengeségeit, amivel bármilyen külső ingerre reagál.

Ugyanis attól, hogy bizonyos beállítások, credential-ok összefüggése nem ismert minden érintett számára/nincs teljes egészében ledokumentálva még a rendszer betonstabilan tud működni.

Lófaszt tud betonstabilan működni. Betonstabilan működik, amíg a környezete változatlan és mivel ugyanazok és/vagy ugyanúgy üzemeltetik, ezért a környezete is olyan, hogy betonstabilan működik, amíg nem változik körülötte semmi, de ha hozzá kell nyúlni bármihez, akkor senki nem mer hozzányúlni, mert bármilyen változástól hanyatt esik a rendszer random része random idő elteltével. Ez nem egy betonstabil rendszer jellemzője, ez az instabil rendszerek jellemzője.

Te a "golyóbiztos" (plusz az utolsó bitig részletesen dokumentált, és a dokumentáció alapján minden üzemeltető számára tökéletesen ismert rendszerek) irányt képviseled, mi meg többen azt, hogy "ha működik, ne piszkáld".

A golyóbiztosnak nem kell utolsó bitig dokumentálva lennie, ha mindenféle üzemszerű stressz teszteket gond nélkül elvisel, de mivel a fejlesztési és üzemeltetési módszertan része a chaos monkey, toxiproxy és társai, ezért a kritikus rendszerek kritikus részei bizony le vannak dokumentálva. Nem alibiből a triviális részek, hogy legyen meg kilóra a dokumentáció, hanem jól felfogott érdekből a problémás és szopatós részek, mert a triviális részeket nem kell dokumentálni.

A "ha működik, ne piszkáld" egy rettentő káros üzemeltetési filozófia, függetlenül attól, hogy mennyien vallják ezt az elvet. Ha nem mersz hozzányúlni, mert mi lesz ha, az üzemeltetési kockázat. Ha egy véletlenszerű eszköz véletlen időpontban történő újraindulása megborít bármit is, akkor ott nem a reboot a probléma, hanem az, hogy ettől bármi megborul. Persze, ezzel szembe kellene nézni, hogy egy foshalmazt üzemeltet az ember, pedig azt a látszatot kell fenntartania kifelé, hogy egy komoly és kritikus rendszert üzemeltet felelősségteljesen, pedig csak futsz mindig oda egy vödör vízzel, ahol éppen nagyobb a tűz. Persze, lehet azt is kommunikálni, hogy egy véletlenszerű eszköz véletlen időpontban történő újraindulása egy incidens, arról készülnek papír hegyek, pecsét, aláírás, fejléc, és minden megy tovább. Na, ezek azok a helyek, amelyeket el kell kerülni.