Előző projecten külön volt választva a fejlesztői és üzemeltetői csapat. Az egyik kedvenc hibám az volt, amikor egy javaban írt webapp időnként hibát dobott mert elérte a process open file handle limitjét. Az üzemeltetés átdobta a labdát a fejlesztőknek, a fejlesztők a logokból pedig arra következtettek, hogy indokolatlanul alacsony a limit, ezért megemeltették azt az üzemeltetéssel. Persze ez nem oldotta meg a problémát, csak elodázta. A végén kiderült, hogy az egyik közvetett függőség volt a hibás, az leakelte a file handle-eket, amiket aztán a garbage collection során futó finalize felszabadított. Ezért ezzel lokálisan soha senki nem találkozott, stressz tesztek meg nem voltak (most nem részletezném hogy miért nem). Végül fejlesztőként összeraktunk egy linux vm-et, abban sikerült reprodukálni a hibát, a nyitott fájlok listázása után már nem volt nehéz megtalálni a hiba forrását. A történet tanulsága számomra az, hogy egyik csapat sem volt hibás, viszont sokat segített volna, ha a hiba nyomozásában segítséget kapunk egy üzemeltetőtől.