( _Franko_ | 2025. 11. 21., p – 11:15 )

Vagyis össze kellett omlasztania a szolgáltatást? :)

Az egy másik kérdéskör. A szolgáltatás teljesen pontosan és helyesen validálta az input-ot és mivel nem fért el, ezért nem tudott elindulni, valószínűleg volt egy rollback a régi feature-list fájlra (lásd crash-restart), majd az adott service/pod/container újra megkapta a rossz méretű fájlt, és ez váltakozott. Ezért volt random fluktuáció az 500-as hibákkal két és fél órán át, amíg rá nem jöttek, hogy nem célzott DDoS támadás miatt állnak le a szolgáltatások, amit először gyanítottak.

Szerintem itt a 'mindent vagy semmit' elvnek kellett volna érvényesülnie, tehát ha a rendszer azt látja, hogy a puffer megtelt, de jön még adat, akkor hibaüzenet, hogy 'túl sok adat, csinálj valamit', és cancel mindenre.

Olvastad, hogy konkrétan mi történt? Időrendben, magyarázatokkal? Szerintem nem.