( Cajga | 2015. 02. 07., szo – 10:16 )

Probaltam elkerulni, hogy leirjam, mert mindenki arra fog fokuszalni, hogy hogyan oldana meg. De mint irtam parszor nem ez a lenyege a topic-nak. Mivel ugy tunik, hogy a kivant FS-em nem letezik, ezert leirom a mi projectunket es meg par use case-t amit el tudok kepzelni.

Szoval nalunk a project az, hogy tobb station kuld adatot egy kozponti DC-be. Ezen az adaton (jelenleg kb 30GB/nap) kozponti serverek jol parallelizalhato nagy szamitasigenyu feladatokat vegeznek. Mivel az algoritmus valtozik/optimalizalodik neha ujra kell kezdeni az egesz data set-en (jelenleg kozel 1PB) vagy csak egy reszen. Mint lathato, mondhatjuk, hogy 1 host ir es a tobbi olvassa az adatot. Jelenleg NFS-el van megoldva de gondoltam ha letezne egy ilyen FS azzal elkerulheto a plusz egy, halozati layer. ClusterFS-ekkel a problema, hogy neha (rekalkulacioknal) tobb server is beszall es ez sok esetben nem annyira egyszeru megoldani. Valamint nem nyujtana jobb megoldast mint az NFS. DistributedFS nem szukseges mivel van high-end storage csilliokert es nem kell software-es megoldason gondolkodnunk. Legegyszerubb az lenne ha csak siman felmountolnam az fs-t az uj server-eken es mehetne is a kalkulacio.

Igazabol barmilyen use case-nel lehetne hasznositani ahol ClusterFS-t hasznalnak de eleg lenne ha csak 1 server irna:
* nagy forgalmu weboldal, ahol tobb server szolgalja ki a tartalmat
* IaaS kornyezetben uj VM-ek inditasanal

Mint fentebb irtam, elso ranezesre egyszeru dolognak tunt es nem ertettem, hogy miert nem talalom ezt az FS-t. Azt gondoltam, hogy a a distributed locking a clusterfs-eknel csak azert kell mert tobb host is irhat egyszerre a file rendszerre es elkerulheto lenne ha csak egy irhatna. Ugy tunik a distributed locking ebben az esetben sem megkerulheto es valoszinu, hogy a TCP/IP stack hasznalata erre jobb megoldas, mint a disk-en keresztuli lock-ing, ezert nem talalom ezt az FS-t :)