Sziasztok!
Adott egy 3 node-os Swarm cluster, amihet strorage-ot akarok csatolni iSCSI-val. Ott tartok most, hogy a 3 nodehoz sikeresen beallitottam az iSCSI initiatort. A fajlrendszerre ket otletem volt, gfs2 vagy ocfs2. Eloszor ocfs2-vel probalkoztam, de sajnos ugy nez ki, bugos egy kisse...(2. node ot mar nem birom felmountolni, ismert hiba, csomo helyen irjak, Ubuntu, Debian, etc... rendszerek alatt) lenyegeben kernele valogatja epp, hogy megy-e, vagy nem... (nyilvan az enyemmel nem, meg amugy sem biznak igy ra semmit...)
Maradt a gfs2. Fontos, hogy HA meg hasonlok nem kellenek, csak egy shared-disk fájl rendszer. folraktam a gfs2-t , meg a dlm-et (kernel modulok + toolok) de nem akar osszejonni... A hiba lenyegeben ugyanaz, mit ezen a linken:
https://www.linux.org/threads/how-to-set-up-shared-gfs2-filesystem-with…
A hibam:
Feb 09 09:12:20 hun25-04v kernel: gfs2: fsid=gitlab:data: Trying to join cluster "lock_dlm", "gitlab:data"
Feb 09 09:12:20 hun25-04v kernel: dlm: no local IP address has been set
Feb 09 09:12:20 hun25-04v kernel: dlm: cannot start dlm lowcomms -107
Feb 09 09:12:20 hun25-04v kernel: gfs2: fsid=gitlab:data: dlm_new_lockspace error -107
Igy formaztam meg a particiot:
mkfs.gfs2 -p lock_dlm -t gitlab:data -j 4 /dev/sdb1
probaltam en is egy /etc/dlm/dlm.conf -ot letrehozni, de nem segitett az sem.
Valami otletetek van erre?
Hozzászólások
Annyival elore vagyok, hogy kozben rajottem, h ezt igy corosync nelkul nem lehet. szoval felraktam azt is es beconfigoltam. A corosync service el is indul szepen, most mar a dlm is probal, de timeoutra fut... valszeg azt is configolni kene... de meg nem jottem ra, hogyan.
OK, egy lepessel megint elore :) a dlm.conf-ot mar felolvassa, viszont a szolgaltatas timeoutol... viszont, amig NEM timeoutol, addig megy a mount parancs...
hmm... ha kikapcsolom a service-t es elinditom kezzel a dlm_controld -t akkor nem all meg, szepen fut... erzekelik is egymast a masik node-al, ha lelovom, akkor irja a masik oldal szepen..
Ilyen a kimenet:
Meg közelebb:)
Jelenleg egy workaround al megy minden!
A lényeg, hogy a dlm service type alappol notify. Viszont a notification nem jön, ami készre jelenti a servicet, ezért az default szerint másfél perc után leáll. Most átállítottam basic re . Így úgy tűnik gond nélkül működik.
A kérdés az mi a notification ami nem jön meg....
en ezzel a kettovel jatszottam, mikor sajat notify-os service-t csinaltam.
TimeoutStartSec=
WatchdogSec=
neked aztan fura humorod van...
sajna nem jon meg kb egy ora mulva sem az OK a service elindulasra... de amugy simple modban ugy latszik, fut rendesen, nem jon semmi error, meg fel is tudom mountolni a fajlrendszert.
Uj info, elv a dlm service akkor jelenti keszre magat, ha a cluster inicializalja magat... ez Pacemaker nelkul sztm nem fog megtortenni.
kerdes, igy biztonsagos-e a hasznalata. (simple service type al)
Huuh, de régen csináltam én gfs2-t clusteren. 7-8 éve körülbelül.
Ami rémlik:
- LVM esetén a locking_type-t át kellett állítani. Ez elvileg nálad nincs.
- Megfelelő portokat ki kellett nyitni a tűzfalon (11111, 21064 és 5404, 5405) - Link: https://access.redhat.com/documentation/en-us/red_hat_enterprise_linux/…
- pcs-sel konfiguráltam a clustert. Ennek 2224/tcp a portja.
Ha 3 node-od van, akkor miért -j 4 opcióval formáztad meg a partíciót?
- Tuzfal nincs a VM-ek kozott, uh az nem lehet a gond
- Nalam nincs "folotte" kontroll, ezt szeretnem igazabol megvalositani: https://people.redhat.com/teigland/cluster4-gfs2-dlm.txt
A 4 csak teszt volt, mar probaltam mindent... :)