locking használata script "ráindítás ellen"

volt egy korábbi téma, de nem jutottam dűlőre

Van egy /etc/cron.hourly/cronjob ami szeretném, ha kihagyna ha már van lockfile-a.
A megoldások amikkel próbálkoztam az volt a gond, hogy vagy ott hagyták a lock-t, de ráindultak vagy a lock kezelés jó volt, de ettől még elindult a script
Van erre működő alkalmazás vagy kezeljem le "kézi vezérléssel"?

A script maga egy rakat file műveletből áll (cp, mv, rsync) és némelyik közt JAVA alkalmazást futtat

Kösz, az építő ötleteket!

2940 megtekintés

[ `pgrep -u "$USER" -cx "$PROGNAME"` -gt 1 ] && exit 1

Vagy valami ilyesmi.

Szerk.: lock file ott hagyást el lehet úgy intézni, hogy ha létezik a lock file, felolvasod belőle a pid-et, s utána megvizsgálod, azzal a pid-del fut-e program, s ha igen, annak az-e a neve, mint ami a script-edé. Ha nem, akkor felülírhatod a lock file-t a saját pid-eddel - vagy létrehozod, de ez ugyanaz -, s futhatsz tovább. Ha igen, akkor meg vársz, csak legyen sleep a ciklusban, vagy visszatérsz hibakóddal, attól függően, mi a cél.

tr '[:lower:]' '[:upper:]' <<<locsemege LOCSEMEGE

0 szavazat

A hozzászóláshoz be kell jelentkezni

http://wiki.bash-hackers.org/howto/mutex

0 szavazat

A hozzászóláshoz be kell jelentkezni

man flock

automatan felszabaditja a lockot, ha a script befejezodott vagy kilotte valami (=lezartak a lock fajlt)

--
A vegtelen ciklus is vegeter egyszer, csak kelloen eros hardver kell hozza!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ubuntu és Debian alatt nem takarítja el és hiába van lock akkor is elindítja a scriptet - elég sokat szórakoztam vele tegnap

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ezért még kapot a pofámba, de:
man systemd.unit (hely, minden unitra érvényes direktívák etc.)
man systemd.service (a valszeg simple vagy one-shot service)
man systemd.timer (az időzítőhöz)

Garantáltan egy példány fog belőle futni (ha a service már egyébként is fut, akkor a timer hatástalan), megmarad a lehetőséged, hogy az időzítőtől függetlenül (mondjuk systemctl-el, vagy bármi más függőségeként - pl. a default targetre, ha újraindítás után azonnal kéne futnia) futtasd garantáltan ugyanazzal a környezettel, etc.

BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Végre valaki, aki nem csak szapulja a systemd-t, hanem megpróbálja használni!

FathoM

0 szavazat

A hozzászóláshoz be kell jelentkezni

A tűz is egy ilyen dolog. Veszélyes, fájdalmas, ha így vesszük rossz.
Aki megtanulta használni, uralkodik. Aki meg nem, az csimpánz.
--
PtY - www.onlinedemo.hu, www.westeros.hu

0 szavazat

A hozzászóláshoz be kell jelentkezni

Vagy épp nem a "mindenre van 123...789 darab majdnem kész megoldás" Linuxot használja :-P

0 szavazat

A hozzászóláshoz be kell jelentkezni

dotlockfile - azt irja a manual, hogy NFS-en is jo

0 szavazat

A hozzászóláshoz be kell jelentkezni

altalaban shell scriptnel:

LOCKFILE=/path/to/lock.file

if [ -f $LOCKFILE ]; then echo "mar futok, szevasz" ; exit 1; fi

date > $LOCKFILE

function finish {
rm -f $LOCKFILE
}

trap finish EXIT

# itt van, amit a script csinal
# ....

--
"nem tárgyszerűen nézem a dolgot, hanem a vádló szerepéből. Sok bosszúságot okoztak, örülnék ha megbüntetnék őket - tudom gyarló dolog, de hát nem vagyok tökéletes." (BehringerZoltan)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Úgy tűnik valami hasonló megoldás marad
Köszi!

0 szavazat

A hozzászóláshoz be kell jelentkezni

ez nem jo, mert nem atomi, futhat tobb, mint ket peldany versenyhelyzet eseten

http://rcrowley.org/2010/01/06/things-unix-can-do-atomically.html

ezekbol lehet epitkezni

--
NetBSD - Simplicity is prerequisite for reliability

0 szavazat

A hozzászóláshoz be kell jelentkezni

Elsőre én is ezt mondanám, de két baj van vele. Az EXIT (másnéven 0) trap SIGKILL esetén nem fog lefutni - és processzt még a kernel is lőhet le sigkill-lel. Másrészt kissé shell megvalósítás függő a dolog. (És értem én, hogy itt most korlátozva vagyunk, mert Linux-ról van szó, meg *valószínűleg* bash-ról, de a Debian bash -> dash váltása anno jól jelezte, hogy nem biztos, hogy érdemes nagyon mély Linuxizm és bashizm dolgokat beleépíteni egy megoldásba.) Pl. a pdksh már sima SIGINT (^C) esetén nem hajtja végre az EXIT trap-et. A FreeBSD-féle sh (ami ash-n alapul) szintén. Ezzel együtt is, ez a ráindulási problémát mindenképp megelőzi, hisz ha nem törlöd, akkor a lock miatt nem indul el :-)

A másik a race-condition, azt pl. bash esetén egy kicsit okosabb lokcfile létrehozással meg lehet oldani:


set -o noclobber
echo $PID > $LOCKFILE || { # ha már van, a noclobber miatt hiba
echo mar futok >&2
exit 1
}

Sajnos a noclobber (amit amúgy a C-shell-ben használtak először) nem standard, ash, dash, stb *tudtommal* nem támogatja (ksh tudja, mind a két féle)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nem jók ezek a megoldások. Simán lehet versenyhelyzet ahol mégis elindul.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Persze, elvileg hibás. Ugyanakkor az mkdir, lockfile parancsok már atomikusak, de a másik, hogy ha a feladat az, hogy cronból indított script-et kell figyelni, ott a versenyhelyzet 1 óra különbséggel áll fenn, tehát a probléma csupán elméleti marad.

tr '[:lower:]' '[:upper:]' <<<locsemege LOCSEMEGE

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nagyon sokat szívtam ezzel annó. Még 1 órás különbségre is nehéz olyan jó megoldást adni, ahol egy ki tudja miért beragadt script-nél jól fogja vizsgálni hogy van-e már versenytárs - éppen azért, mert bárhol lehet a hiba.

Csak azt mondom hogy "jó" megoldást nehéz adni shellből önmagából.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Igen, ezzel egyetértek. Saját scriptjeimben magam is gányolni szoktam.

tr '[:lower:]' '[:upper:]' <<<locsemege LOCSEMEGE

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ha már gány megoldás: nyiss egy tcp portot a localhostra. Ha sikerül, a script végén bezárod. Ha nem, akkor valaki már fogja.
--
PtY - www.onlinedemo.hu, www.westeros.hu

0 szavazat

A hozzászóláshoz be kell jelentkezni

én ezt úgy oldottam meg, hogy nagyjából tudom mennyi idő alatt kell végezzen, egy egyszerű dameon fut ami nézi a kritikus scripteket, hogy mióta futnak és ha elérnek egy kritikus időt (vártnál jóval tovább fut) akkor dob egy figyelmeztető levelet nekem, hogy ez és ez van. stdout/err-t célszerű loggolni, ezt probléma esetén dobja ftpre nálam levél után ... nyilván ez sem tökéletes megoldás, nekem amire kell bevált és megy :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Azért az igényesség kedvéért tegyük hozzá, hogy több fent írt megoldás nem 100%-os, csak mondjuk 99.999% :). Lockolásnál két dolog számítana, egyrészt atomi legyen a lock művelet, másrészt automatikusan takarodjon el a lock bármilyen esetben. Tehát a "megnézem, hogy fut-e, és ha nem, elindítom" módszerben race condition van, és szerintem létezik olyan súlyos hiba, amikor mondjuk egy trap nem fut le a scriptben (SEGV/KILL?). Értem én, hogy ezeknek nagyon kicsi az esélye, de ha production rendszerről van szó, és nem akarod X hónap után azt látni, hogy már 17 példányban fut, vagy hetek óta nem indult el, akkor érdemes biztosra menni.

0 szavazat

A hozzászóláshoz be kell jelentkezni

létezik olyan súlyos hiba, amikor mondjuk egy trap nem fut le a scriptben (SEGV/KILL?)

kerdes, hogy egy ilyen hibanak mi a valoszinusege, ill. egyaltalan mi okozza, tovabba megfelelo monitorozassal + beavatkozassal elkerulheto-e?

0 szavazat

A hozzászóláshoz be kell jelentkezni

Számomra kérdés, hogy akkor nem egyszerűbb-e már azonnal az ezekre a problémákra kulcsrakész megoldást adó systemd-t használni (plusz egy service, hogy hogyan értesítsen és egy OnFailure direktíva a service-hez).

BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Systemd-vel sima user joggal futó scriptre lehet lock-ot csinálni? Az az érzésem, csak service-ra. Tudom, most ez kell, a kérdésem független a konkrét problémától.

tr '[:lower:]' '[:upper:]' <<<locsemege LOCSEMEGE

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ha felviszed user modú serviceként (vagyis a user systemd instance vezérli), akkor akár lehet is, de az már tényleg tákolás.

BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)

0 szavazat

A hozzászóláshoz be kell jelentkezni

nem mindenhol van systemd, ill. itt most cron job-rol volt szo, nem service-rol, amihez meglep, hogy koze van(?) a systemd-nek

0 szavazat

A hozzászóláshoz be kell jelentkezni

Annyiból van köze, hogy tud timer unitot is kezelni, amivel részben ki lehet váltani a cron-t. Értelme pedig annyi mindenképp van, hogy így ugyanazokkal az eszközökkel tudod lekorlátozni, hogy egy-egy cronból futó feladat mit érhet el, kinek a nevében fusson stb., mint a többi rendes service-nél.

BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)

0 szavazat

A hozzászóláshoz be kell jelentkezni

hattooo.... ertem, hogy a systemd lassan mar a bongeszot, meg a kernelt is ki tudja valtani, de en maradnek a jo oreg Dillon cron-nal...

2 szavazat

A hozzászóláshoz be kell jelentkezni

0 szavazat

A hozzászóláshoz be kell jelentkezni

0 szavazat

A hozzászóláshoz be kell jelentkezni

HUP te Zsiga !

0 szavazat

A hozzászóláshoz be kell jelentkezni

hat pedig ha jol tudom akkor flock epp atomic. (kiveve a lock convertalast). a lock pedig automatan felszabadul ha a leirot lezarjak (close hivas vagy a system egy kill utan)

es most kiprobaltam trustyn a man oldalon levo test scryptet, jol mukodott (a fajl ugyan ott marad, de az nem is lenyeg)

--
A vegtelen ciklus is vegeter egyszer, csak kelloen eros hardver kell hozza!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Igen a flock(1) szerintem tökéletes. Ezért írtam, hogy több megoldás nem tökéletes, de nem mind :).

0 szavazat

A hozzászóláshoz be kell jelentkezni

ki kene probalni, hogy felszabadul-e a lock, ha itt is jon a SEGV/KILL...

0 szavazat

A hozzászóláshoz be kell jelentkezni

a kill utan a system eltakaritja a szemetet, es lezarja a fajl. a fajl lezarassal meg felszabadul a lock. epp ezert talaltak ki ezt :)

--
A vegtelen ciklus is vegeter egyszer, csak kelloen eros hardver kell hozza!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ezért szeretek jobban mikrokontrollerre assembly-ben programozni. Azt, hogy valami atomikus legyen, könnyebben tudom biztosítani, pontosan tudható, mi az, s mi nem, mert én csinálom.

Mi erre a teljesen korrekt megoldás? Láttam a linkelt blogban az

if mkdir "/tmp/$LOCKDIR"; then

kezdetű megoldást. Az mkdir atomikus? Különben tetszik, mert ha az, akkor jó is lehet, nem előbb vizsgálunk, majd ha nincs lock, utána létrehozzuk azt, mert ez így nyilván nem atomikus. Az mkdir hibával jön vissza, vagy létrehozza a $LOCKDIR-t. Egyrészt nem tudom, mikor válthat taszkot a kernel, másrészt több magvas gépen egyszerre futhatnak kódok, harmadrészt nem tudom, a filerendszerben hogyan managelik az efféle ütközéseket, hogyan állnak ezek sorba.

tr '[:lower:]' '[:upper:]' <<<locsemege LOCSEMEGE

0 szavazat

A hozzászóláshoz be kell jelentkezni

Atomikusnak jó trükk ez az mkdires megoldás, de a takarítást nem tudod garantálni.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Abba a könyvtárba lehet tenni pid file-t, a pid-et lehet ellenőrizni, hogy fut-e, s milyen névvel, bár ezzel valóban megint az a gond, hogy körülményes és nem 100 %-osan biztos megoldás. :(

tr '[:lower:]' '[:upper:]' <<<locsemege LOCSEMEGE

0 szavazat

A hozzászóláshoz be kell jelentkezni

Igen, ezt tetszőlegesen lehet bonyolítani, és 99, 99.9, 99.99, 99.999... százalékosan garantálni, hogy tényleg működik. De annak a fényében, hogy ez általános értelemben egy bonyolult, viszont legtöbb esetben kernel szinten már megoldott dolog, kb. fölöslegesen minden más próbálkozás, mert így szinte ingyen kapsz sok 9-est. Persze abba is bele lehet kötni, hogy a kernel sem 100%-os, de ott már akkor más bajok és vannak, és általában ezt praktikusabb figyelmen kívül hagyni.

0 szavazat

A hozzászóláshoz be kell jelentkezni

cron.hourly-nál mennyire elvárt az atomikus működés? :)
--
PtY - www.onlinedemo.hu, www.westeros.hu

0 szavazat

A hozzászóláshoz be kell jelentkezni

Hát... ha van akkora load, hogy két egymást követő egyszerű shell parancs nem fut le egy órán belül... :D

tr '[:lower:]' '[:upper:]' <<<locsemege LOCSEMEGE

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ott nem a lock és a ráfutás a baj :)
--
PtY - www.onlinedemo.hu, www.westeros.hu

0 szavazat

A hozzászóláshoz be kell jelentkezni

+1+1

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ha a lock kezelés jó, nem indul rá a másik script, és nem marad ott a "szemét"
--
PtY - www.onlinedemo.hu, www.westeros.hu

0 szavazat

A hozzászóláshoz be kell jelentkezni

runit csomagból a "chpst -L"

0 szavazat

A hozzászóláshoz be kell jelentkezni

lockfile -r 0 /var/run/azenjokislockfileom || exit 0
...
rm -f /var/run/azenjokislockfileom

/etc/rc.local -ból esetleg le lehet törölni de szerintem a /var/run -t törli rebootkor.
esetleg lehet a /tmp -be is pakolni

--
Gábriel Ákos
http://ixenit.com

0 szavazat

A hozzászóláshoz be kell jelentkezni

A /tmp sok esetben eleve RAM-ban van, hiszen tmpfs, viszont egy szerver uptime-ját nézve azt hiszem, az nem sokat segít, ha 2 évente újraindítják, s akkor törölve lesz a lockfile. :)

tr '[:lower:]' '[:upper:]' <<<locsemege LOCSEMEGE

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ott az rm a script végén, szóval jó esetben törli.
Akkor lenne gáz, ha elindul a script, van egy lockfile majd reboot és a lockfile ottmarad, akkor sose többet nem indul el a script.

Bár azzal még ki lehet egészíteni hogy mondjuk 4 óránként ránéz egy másik cronjob, ha talál régi lockfile-t (mondjuk 2 óránál régebbit) akkor a beragadt programot pusztítja és a lockfile-t is törli. Esetleg ír egy levelet az adminnak.

--
Gábriel Ákos
http://ixenit.com

0 szavazat

A hozzászóláshoz be kell jelentkezni

Az rm-et láttam, de az SIGKILL, SIGSEGV ellen nem véd! :) Valami olyasmit érdemes, hogy a lockfile-ban pid is van, azt névre ellenőrizni, valóban fut-e a process, ami már lényegesen nagyobb valószínűséggel ad helyes eredményt, de ez sem 100 %-os.

tr '[:lower:]' '[:upper:]' <<<locsemege LOCSEMEGE

0 szavazat

A hozzászóláshoz be kell jelentkezni


exec 200<"$0"; flock -n 200 || { echo "$0 már fut"; exit 1; }

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ez szép. Itt egy cikk hozzá: http://www.kfirlavi.com/blog/2012/11/06/elegant-locking-of-bash-program/
--
Gábriel Ákos
http://ixenit.com

0 szavazat

A hozzászóláshoz be kell jelentkezni

nice

0 szavazat

A hozzászóláshoz be kell jelentkezni

A < $0 milyen fájlt akar olvasásra megnyitni, ha nem abszolút elérési úttal indítottam el a programot? (És újra kötekedés, hibaüzenet STDERR-re megy, nem STDOUT-ra, szóval echo >&2 )

0 szavazat

A hozzászóláshoz be kell jelentkezni

A 200-as file descriptor éppen szabad, felhasználható? Nem így helyes?
exec {fd}< "/tmp/lockfile"; flock -n "$fd" || { echo "$0 már fut" >&2; exit 1; }

tr '[:lower:]' '[:upper:]' <<<locsemege LOCSEMEGE

0 szavazat

A hozzászóláshoz be kell jelentkezni

lehetne, de nem valószínű hogy 1-nél több program lesz egy gépen amit védeni kellene az újbóli ráindítástól, de ha mégis, akkor sem lehet nehéz feladat megjegyezni 2 számot :)

a másik, hogy mivel saját magát nyitja meg olvasásra, ami ugye biztos hogy létező, és olvasható file, mivel egyszer már megnyílt amikor elindult az sh-ban, nincs szükség kölön .lck file-ra amit vagy létre tudsz hozni, vagy nem, - jogosultsági problémák lehetnek stb, stb.. - vagy törlődik a script lefutása után, vagy nem. -pl hiba esetén stb stb.. -

0 szavazat

A hozzászóláshoz be kell jelentkezni

Szerintem ezt kimaxoltad, kíváncsi vagyok, ennél jobbat sikerül-e valakinek :).

0 szavazat

A hozzászóláshoz be kell jelentkezni

Egyszer már leírtam: tfh a programod neve "lo". Ha ez a kis programocska olyan helyen van, amelyik könyvtár a PATH-ban is szerepel, és elérési útvonal nélkül indítod, akkor a $0-ban csak annyi van, hogy "lo" - márpedig ezt az átirányításnál a shell az aktuális munkakönyvtárban szereplő "lo" nevű fájlnak fogja érteni - következésképp nem biztos hogy létezik, vagy van hozzáférési jogod.

0 szavazat

A hozzászóláshoz be kell jelentkezni


:/usr/local/bin# cat d0test 
#!/bin/sh

echo "$0"


:/usr/local/bin# d0test 
/usr/local/bin/d0test

:/usr/local/bin# ./d0test 
./d0test

Én pedig elegánsan figyelmen kívül hagytam
Window$nál lehet, de itt biztos nem :))

0 szavazat

A hozzászóláshoz be kell jelentkezni

Hm. Nemértem. (Amúgy most kipróbáltam, nálam is.)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Szerintem ez valami bash-feature. "Rendes" körülmények között az argv[0] nem csinálja ezt. Persze ha úgy hívod meg, hogy "bash scriptnév", akkor ő sem fogja ezt csinálni...

0 szavazat

A hozzászóláshoz be kell jelentkezni

"bash scriptnév" esetben ez nem létező probléma, mert ilyenkor a shell nem keres a PATH-ban, tahát ahol ő megtalálja a fájlt, ott a program is megtalálja önmagát.
A bashizm jó ötlet, kár, hogy FreeBSD alatt kipróbálva a gyári sh és a csomagból telepített pdksh, ksh93 és bash is ugyanígy működik. (Ellenőrzéshez beletettem egy "ps -o command= $$" sort az echo elé, és így szépen látszik, hogy milyen shell fut (#! /usr/local/bin/ksh93 formában van a sheebang, és ez alapján lassan kezdem érteni és azt hinni, hogy ennek tényleg így kell lennie :-( )

0 szavazat

A hozzászóláshoz be kell jelentkezni

Közben megnéztem, és nem bash-feature, hanem a shebang-sort interpretáló OS kód csinálja, hiszen annak kell paraméterként átadnia a futtató bináris számára, hogy hol is van a script, amit futtatnia kell. Itt pedig nyilván nem működne az, hogy "majd az a program interpretálja a PATH-t", mivel az egy mezei közönséges paraméterként kapja meg a script nevét.

Szóval egyetértünk: ez így jó, így van kitalálva, máshogy nem is tudna működni.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nem lehet bash feature, mert /bin/sh a futtatókörnyezet...
--
PtY - www.onlinedemo.hu, www.westeros.hu

0 szavazat

A hozzászóláshoz be kell jelentkezni

A /bin/sh sok esetben egy link a (/usr)/bin/bash-ra.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Vagy máshová.

$ ls -la /bin/sh
lrwxrwxrwx 1 root root 4 máj 4 2012 /bin/sh -> dash

--
PtY - www.onlinedemo.hu, www.westeros.hu

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ez egy másik sok eset :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ja, szinte minden .deb alapú OS alatt ez van :)
--
PtY - www.onlinedemo.hu, www.westeros.hu

0 szavazat

A hozzászóláshoz be kell jelentkezni


exec {fd}<"$0"
flock -n $fd || { echo "$0 már fut" >&2; exit 1; }

? A fix fd tényleg csúnya.

0 szavazat

A hozzászóláshoz be kell jelentkezni

sub

0 szavazat

A hozzászóláshoz be kell jelentkezni

Előszeretettel használom ezt,
http://timkay.com/solo/

0 szavazat

A hozzászóláshoz be kell jelentkezni

Friss hozzászólások

Mit? Hogy a TiO2 kemenyebb,… 2025-09-29T10:58:05+0200
Ez bazmeg nagyon beteg. Pár… 2025-09-29T10:57:41+0200
Nincs patreonom.

Nekem… 2025-09-29T10:57:41+0200
:D
Ekkora terelést öcsém … 2025-09-29T10:56:02+0200
Nincs patreonom. 2025-09-29T10:53:51+0200
Kommentnél nem volt. 2025-09-29T10:50:14+0200
Áprilisi koncertre tudtam… 2025-09-29T10:42:51+0200
Megoldás: Kelj később,… 2025-09-29T10:41:48+0200
Tehát magyarul. Helyes! 2025-09-29T10:41:52+0200
Köszönöm. 2025-09-29T10:37:19+0200

locking használata script "ráindítás ellen"

Hozzászólások