condor@debian/wheezy

Fórumok

Sziasztok!

Probalnek osszeloni egy targybeli condor clustert ~feltucat geppel. Debian/wheezy alatt, dpkg-reconfigure condor-os beallitasokkal. A felhasznalas a leheto legegyszerubb lenne, azaz:
- csak a binaris kerul megosztasra a gepek kozott, de azok akar /usr/local/bin ala' is telepithetoek minden gepre kulon-kulon;
- az egyes jobok stdin-stdout-on keresztul kommunikalnanak (konkretan a job-ok stdin-je kozos, stdout-ra irja az output-ot);
- csak parancssoros argumentumok kulonboztetik meg az egyes job-okat, a $(Process) ezt elintezi nagyon szepen;
- semmi condor-specifikus API vagy extension nem kell: az egyes jobok mezei egyszalu, zero kommunikacioju es szinkronizacioju feladatok.

Mindez szepen mukodik egy gepen, de tobb gepre latszolag nem kerulnek kiosztasra a dolgok. Azaz a condor_status szepen mutatja az egyes slot-okat (jelenleg 3 gepen), tuzfal nyitva (az egyes condor node-os gepek kozott teljesen, oda-vissza; szoval nem csak a 9618-as port). Loggok alapjan semmi hibajelzes nincs. Amig a condor_submit-nak a

should_transfer_files = YES

beallitasa volt ervenyben, addig persze volt hibara utalo jel a loggokban (azaz hogy nem birta atmasolni a file-okat a masik gepre, igy csak a submitter gepen futtatott - de ott jol). Ami teljesen ertheto mert semmit nem tettem ennek erdekeben ;) Nincs, es nem is akarok NFS-t meg ilyesmit.

Valami ``simple mini stdin/out-based condor pool for dummies'' otlet, tapasztalat, barki reszerol? Jo lenne maradni az off-the-shelf debian beallithatosagok mellett, igy kezzel pl az /etc/condor/condor_config file-t nem is piszkalnam, ha nem muszaj.

koszonet, A.

Hozzászólások

ugy nagyjabol egy ilyesmi konfiggal kiserletezgetek most:


# First block
 N = 100

 universe               = vanilla
 should_transfer_files  = NO
 initialdir             = /home/apal/work/condor

 input   =
 output  = echo_example.$(Cluster).$(Process).out
 log     = echo_example.$(Cluster).log

 # Second block
 executable          = /bin/bash
 transfer_executable = False
 arguments           = "-c 'echo scale=2000\;4*a\(1\) | bc -l; echo $HOSTNAME'"

 queue $(N)

Szoval ezen tobb minden miatt is egyertelmuen kellene latszani hogyha masik gepen levo slot-okra is kiosztja a feladatot. De nem...