( Pene | 2019. 09. 16., h – 15:23 )

Előző héten kiesett nálunk is egy "apró" systemd bug, ami ismét megerősített abban, hogy ahol lehet, még hanyagoljam a systemd-t, nem elég kiforrott/stabil. Van egy elég komplex rendszerünk AWS-en, aminek egyik része kb. 4000 darab EC2 instance-t foglal magában (különböző típusúak és nagyságúak, tehát pl. de ugyanarra a custom AMI-ra építve működtetik ugyanazt a cél szolgáltatást, ami nekünk épp kell). Ezeken akartunk némi systemd-vel ütemezett, halálosan egyszerű mókát futtatni minden instance-on a v229-ben bevezetett "RandomizedDelaySec" segítségével. Mondanom sem kell, hogy az insták 1-2%-án nem futott le az időzített processz... Log üres, minden üres, csak azt látni, hogy pár tucat instance-on nem történik semmi, holott a timer listában (gyk. betöltve) ott van aminek lennie kell. Pedig kéne... Semmi hasonlóság, ismétlődés nincs az insták (típusai) között, és már vagy két hete meg vagyunk lőve a kérdésben...