HA Cluster gond - megoldva

Fórumok

Adott két node, ami eddig szépen ment, de hálózat változtatás óta szétugrottak, és azóta mindegyik azt hisz magáról hogy Ő a Fő DC.

kitöröltem már a létező összes configot kidobtam a cluster beállításokat, cib.xml - eket töröltem mindenhonnan és képtelen összehangolódni. Újratelepítettem már mind a két helyen az openaist, peacemakert, meg mindent ami kell hozzá.

ezt mondják:

node1:
crm_mon -1

Last updated: Fri Jan 7 14:03:48 2011
Stack: openais
Current DC: node1 - partition with quorum
Version: 1.1.2-2e096a41a5f9e184a1c1537c82c6da1093698eb5
2 Nodes configured, 2 expected votes
0 Resources configured.
============

Online: [ node1 ]
OFFLINE: [ node2 ]

logja:
ERROR: crmd_ha_msg_filter: Another DC detected: node2 (op=noop)

node2:
crm_mon -1

Last updated: Fri Jan 7 14:03:44 2011
Stack: openais
Current DC: node2 - partition with quorum
Version: 1.1.2-2e096a41a5f9e184a1c1537c82c6da1093698eb5
2 Nodes configured, 2 expected votes
0 Resources configured.
============

Online: [ node2 ]
OFFLINE: [ node1 ]

logja:
ERROR: crmd_ha_msg_filter: Another DC detected: node1 (op=noop)

Hozzászólások

cib.xml - eket töröltem mindenhonnan
TILOS kézzel hozzányúlni, vagy bármit módosítani! Mindent a CRM shellen keresztül!

partition with quorum
quorum-ot két gép esetén le kell tiltani
--
Discover It - Have a lot of fun!

crm config show

/ha jol remlik/ kimenetet dobj mar.

Közbe változott a dolog, a node2 UNCLEAN lett.

crm_mon -1
node1:

============
Last updated: Mon Jan 10 09:46:36 2011
Stack: openais
Current DC: node1 - partition with quorum
Version: 1.1.2-2e096a41a5f9e184a1c1537c82c6da1093698eb5
2 Nodes configured, 2 expected votes
0 Resources configured.
============

Node node2: pending
Online: [ node1 ]

node2:
============
Last updated: Mon Jan 10 09:46:51 2011
Stack: openais
Current DC: node2 - partition WITHOUT quorum
Version: 1.1.2-2e096a41a5f9e184a1c1537c82c6da1093698eb5
2 Nodes configured, 2 expected votes
0 Resources configured.
============

Node node1: UNCLEAN (offline)
Online: [ node2 ]

kimenetek:
crm configure show

node1:

node node1
node node2
property $id="cib-bootstrap-options" \
dc-version="1.1.2-2e096a41a5f9e184a1c1537c82c6da1093698eb5" \
cluster-infrastructure="openais" \
expected-quorum-votes="2"

node2:

node node1
node node2
property $id="cib-bootstrap-options" \
dc-version="1.1.2-2e096a41a5f9e184a1c1537c82c6da1093698eb5" \
cluster-infrastructure="openais" \
expected-quorum-votes="2"

cibadmin -Ql kimenetek

node1:

cibadmin -Ql

node2:

Azt tudom hogy a quorum ot ki kell szedni ha 2 gép van de az csak akkor számít ha szolgáltatás is fut rajta, akkor azt nem futtatja, pl felhúzol egy közös IP-t akkor ha az egyik kiesne es a qourum nincs kikapcsolva akkor lekapcsolja a másokról is, de az összekapcsolódáshoz nincs köze.

Aki hasonló hibába esne és már a fél világot szét tcpdumpolta és a gépei között két switch lenne annak a megoldás:

A két switch között nincs multicast kommunikáció, amire szükség lenne az openais clusterhez.

http://www.openais.org/doku.php?id=faq:cisco_switches

Thx a segítséget mindenkinek.