RHEL5 alapú, 2 node-os, egy irányba automatikusan átkapcsolós, egy aktív lábas NFS clustert építenénk quorum diskkel és HP iLO -s fencinggel.
A konfig file-t conga-val, system-config-cluster -rel és kézzel raktuk össze (úgy tűnik, ezzel a három módszerrel lehet szintaktikailag és tartalmilag is megfelelőnek látszó konfigot készíteni).
A probléma: hiába van quorum disk (mindkét gépre RW módban felcsatolva) és hiába van ping alapú heurisztika, a node-ok veszett harcba kezdenek és folyamatosan elfence-elik egymást (HP iLO-n át reboot).
Ez a cluster.conf, van vkinek ötlete, hogy mi a gond?
- 1632 megtekintés
Hozzászólások
ket gyanus pont van:
1. a quorum sulya
2. tenyleg tud-e lock-ot tenni a diszkre
- A hozzászóláshoz be kell jelentkezni
Ez nagyon nem jó, ha van quorum, ergo 3 szavazat. Helyesen:
A heuristic tag-ben a ping-et érdemes teljes útvonallal fölvenni, ártani nem árt. Arra figyelj, hogy valami olyan IP-t pingess, ami mindig válaszol (pl. default GW VRRP-vel), mert különben repül a cluster. :))
A recovery-t érdemes restart-ra állítani relocate-ről, mert az erőforrásbarátabb és ha a node működőképes, amin a szolgáltatás elhasalt, akkor hamarabb visszajön.
A többi első nekifutásra jónak tűnik.
A Conga nem rossz, a system-config-cluster kifejezetten hülye, sokszor a saját maga által generált XML-t invalidnak mondja, ha legközelebb szerkesztenéd. A legjobb módszer az, hogy
1. elmész RHEL Cluster tanfolyamra és megkapod a tankönyvet :))
2. megcsinálod az XML-t Congával
3. kézzel reszelsz rajta és ccs_tool-lal teríted az új verziót.
--
Wir sind erfaßt, sind infiziert,
Jedes Gespräch wird kontrolliert.
- A hozzászóláshoz be kell jelentkezni
Basszus, idióta drupal kiszedte az XML tageket. :I
Megpróbálom újra.
Ez teljesen hülye, írom normál zárójelekkel inkább.
(cman expected_votes="2" two_node="1"/)
Helyesen:
(cman expected_votes="3" two_node="0"/)
--
Wir sind erfaßt, sind infiziert,
Jedes Gespräch wird kontrolliert.
- A hozzászóláshoz be kell jelentkezni
Köszi mindenkinek.
---
Hogyan tudom ellenőrizni, hogy tényleg tesz-e bármelyik node lockot a quorum diskre?
---
Frissítettem a közzétett konfigot a fentiek szerint (kivéve a relocate - restart részt).
Elindítom a node1-en a cmant:
service cman start
Elindul, tesz-vesz, nem hozza fel a service ip-t, de elbootolja a node2-t (amin még nem futott a cman).
node2 elbootolása után node2-n is elindítom a cman-t, mire az elkezd görcsölni
service cman start
Starting cluster:
Loading modules... done
Mounting configfs... done
Starting ccsd... done
Starting cman... done
Starting daemons... done
Starting fencing...
A logba meg ilyeneket ír:
ccsd[4848]: Cluster is not quorate. Refusing connection.
ccsd[4848]: Error while processing connect: Connection refused
---
Nem értem. :)
- A hozzászóláshoz be kell jelentkezni
mit mond a clustat?
quorum létrehozás/ellenőrzés: http://linux.die.net/man/8/mkqdisk
- A hozzászóláshoz be kell jelentkezni
nincsenek selinux denial bejegyzesek a logokban?
- A hozzászóláshoz be kell jelentkezni
Hulye kerdes, de firewall es selinux ugye ki van kapcsolva?
- A hozzászóláshoz be kell jelentkezni
Nincs hülye kérdés! :)
-------------------
1. quorum disk állapota:
--- node1:
$ mkqdisk -L
mkqdisk v0.6.0
/dev/dm-6:
/dev/mapper/disk_quorump1:
/dev/mpath/disk_quorump1:
Magic: eb7a62c2
Label: nfs_quorum
Created: Thu Sep 9 08:42:54 2010
Host: node1
Kernel Sector Size: 512
Recorded Sector Size: 512
--- node2:
$ mkqdisk -L
mkqdisk v0.6.0
/dev/dm-6:
/dev/mapper/disk_quorump1:
/dev/mpath/disk_quorump1:
Magic: eb7a62c2
Label: nfs_quorum
Created: Thu Sep 9 08:42:54 2010
Host: node1
Kernel Sector Size: 512
Recorded Sector Size: 512
-------------------
2. SELinux
--- node1
$ getenforce
Disabled
--- node2
$ getenforce
Disabled
-------------------
3. iptables
--- node1
$ iptables-save
*mangle
:PREROUTING ACCEPT [756860:113927093]
:INPUT ACCEPT [749172:113143978]
:FORWARD ACCEPT [0:0]
:OUTPUT ACCEPT [92483:18203832]
:POSTROUTING ACCEPT [93088:18335960]
-A OUTPUT -d 230.1.2.3 -j TTL --ttl-set 128
COMMIT
--- node2
$ iptables-save
*mangle
:PREROUTING ACCEPT [756860:113927093]
:INPUT ACCEPT [749172:113143978]
:FORWARD ACCEPT [0:0]
:OUTPUT ACCEPT [92483:18203832]
:POSTROUTING ACCEPT [93088:18335960]
-A OUTPUT -d 230.1.2.3 -j TTL --ttl-set 128
COMMIT
- A hozzászóláshoz be kell jelentkezni