( XMI | 2022. 10. 26., sze – 01:06 )

"Két szolgáltatásuk van. Az első még a felhős idők előtt indult"

Igen, szerintem pont ez a lényeg. Ők - ha jól veszem ki a szövegből - igazából sosem számolták fel az on-prem szolgáltatásaikat. Így nagyságrendekkel egyszerűbb visszahozni valamit, mintha 1) sose lett volna on-prem tapasztalatuk 2) volt, "de már elmúlt" és 0-ról újra kell építeni.

"Üzemeltetni pedig a felhős rendszert is kell és ahhoz képest a vasakkal nem sok dolog van, nekem is ez a tapasztalatom."

Egyrészt nagyon más expertise kell hozzá (csináltam többféle felállást: fizikai infrát üzemeltettem, dolgoztam devopsosként olyan cégnél ahol volt on-prem infra de más részleg üzemeltette a vasat, dolgozok most is AWS-t használó helyen, sőt üzemeltettem cloud-ot is fizikai infra felett - szóval azt hiszem láttam egy pár oldalról ezt a kérdéskört). Egy AWS-hez szokott devopsosnak nagyon nagy kultúrsokk lesz hirtelen a Cisco/HP/Juniper/Nortel stb. switcheken VLAN-okat konfigurálni, fibre-channel-el először találkozni, brand szerverek proprietary ~~nyűgjeit~~ remote management, hálózat/storage virtualizációs technológiáit megtanulni, PXE-bootos remote installt csinálni. Időbe kerül áttanulni egyikről a másikra.

Másrészt eddig akárhány cégnél voltam, mindig orbitális szívás volt az on-prem infra részeit üzemeltető külön szervezeti egységek vagy esetleg külső cégek közötti együttműködéssel. Sosem sikerült világosan elkülönített felelősségi határokat húzni. Visszagondolva rengetegszer volt outage a fizikai infra vagy felette a VI réteg üzemeltetési hibáiból ("oops, rossz szervert állítottunk le", "oops rossz kábelt húztunk ki", "tönkrement az SFP modul a FC porton, és valamiért nem ment a link failover", "nem vettük észre, hogy ezen a hypervisoron még fut egy prod vm és leshutdownultuk", "nem teszteltük, hogy működik-e a routeren az ISP failover és kiderült hogy nem", stb. stb.). És akkor még nem beszéltem az akár 1 évig nyitva álló ticketekről, amit a network operations-nek feladtunk (vicces volt, mikor azzal zárták le, hogy mivel átálltunk AWS-re, így ezt már nem is kell megcsinálniuk :) ). Rengeteg szervezési overheaddel járt egy rutin site failover is. Az AWS-re átállás és ezáltal a dolgok saját kézbe vétele óta az ilyen jellegű problémák teljesen megszűntek.

Megintcsak nem állítom, hogy ez mindenhol így kell hogy legyen, de néhány elég nagy multinál eddig ezeket tapasztaltam. Van egy gyanúm, hogy ez lehet az általánosabb, és DHH-ék cége inkább a pozitív kivétel.