sun cluster install megall a node2 ujraindítása után

Hali!

A következő problémával küzdök és sehol nem találom a megoldást:
2 gép, solaris 10 u6 és sun cluster 3.2

scinstall-al elkezdem a telepítést, és miután a node1 bekonfigurálta a node2-t, rebootolja. Reboot megtörténik, és a node1 csak vár és vár és vár.

Log:

*** Create a New Cluster ***
Thu Jan 22 23:43:21 CET 2009

Attempting to contact "solaris2" ...

Searching for a remote configuration method ...

The secure shell (see ssh(1)) will be used for remote execution.

----------------------------------
- Cluster Creation -
----------------------------------

Testing for "/globaldevices" on "solaris1" ... done
Testing for "/globaldevices" on "solaris2" ... done

Checking installation status ...

The Sun Cluster software is installed on "solaris1".
The Sun Cluster software is installed on "solaris2".

Starting discovery of the cluster transport configuration.

The following connections were discovered:

solaris1:e1000g2 switch1 solaris2:e1000g2
solaris1:e1000g3 switch2 solaris2:e1000g3

Completed discovery of the cluster transport configuration.

Started sccheck on "solaris1".
Started sccheck on "solaris2".

sccheck completed with no errors or warnings for "solaris1".
sccheck completed with no errors or warnings for "solaris2".

Configuring "solaris2" ...

ssh root@solaris2 -o "BatchMode yes" -n "/bin/sh -c '/usr/cluster/lib/scadmin/li b/cmd_install -logfile /var/cluster/logs/install/scinstall.log.11067 -k -C clust er -F -T node=solaris1,node=solaris2,authtype=sys -w netaddr=172.16.0.0,netmask= 255.255.248.0,maxnodes=64,maxprivatenets=10 -A trtype=dlpi,name=e1000g2 -A trtyp e=dlpi,name=e1000g3 -B type=switch,name=switch1 -B type=switch,name=switch2 -m e ndpoint=:e1000g2,endpoint=switch1 -m endpoint=:e1000g3,endpoint=switch2 -P task= quorum,state=INIT; /bin/echo SC_COMMAND_STATUS=\$?'"

Checking device to use for global devices file system ... done

Initializing cluster name to "cluster" ... done
Initializing authentication options ... done
Initializing configuration for adapter "e1000g2" ... done
Initializing configuration for adapter "e1000g3" ... done
Initializing configuration for switch "switch1" ... done
Initializing configuration for switch "switch2" ... done
Initializing configuration for cable ... done
Initializing configuration for cable ... done
Initializing private network address options ... done

Setting the node ID for "solaris2" ... done (id=1)

Checking for global devices global file system ... done
Updating vfstab ... done

Verifying that NTP is configured ... done
Initializing NTP configuration ... done

Updating nsswitch.conf ... done

Adding cluster node entries to /etc/inet/hosts ... done

Configuring IP multipathing groups ...done

Verifying that power management is NOT configured ... done

Ensure network routing is disabled ... done

Please reboot this machine.

Log file - /var/cluster/logs/install/scinstall.log.11067

SC_COMMAND_STATUS=0

ssh root@solaris2 -o "BatchMode yes" -n "/bin/sh -c '/usr/cluster/lib/scadmin/li b/cmd_test hasbooted; /bin/echo SC_COMMAND_STATUS=\$?'"
This node has not yet been booted as a cluster node.
SC_COMMAND_STATUS=0
Rebooting "solaris2" ...

ssh root@solaris2 -o "BatchMode yes" -n "/bin/sh -c '/usr/cluster/lib/scadmin/li b/cmd_reboot; /bin/echo SC_COMMAND_STATUS=\$?'"
SC_COMMAND_STATUS=0

scrconf -x 86400 -N solaris2

és hát a félkövérrel jelölt rész menne vagy a végtelenségig...

Valakinek valami ötlet?
Hosts fájl rendben van, egymásra betudnak ssh-zni root-tal stb. rpc/bind-ben a local_only és a tcpwrappers false-ra van állítva.

Hozzászólások

Nem nagyon ertek hozza, de ennek a sornak ott kell lennie?:

ssh root@solaris2 -o "BatchMode yes" -n "/bin/sh -c '/usr/cluster/lib/scadmin/li b/cmd_test hasbooted; /bin/echo SC_COMMAND_STATUS=\$?'"
This node has not yet been booted as a cluster node.

Ebben a file-ban mi van?
var/cluster/logs/install/scinstall.log.11067

Valamint a solaris2-on biztos sikeres volt a telepites? Megneznem azt a nodot a log file-okkal mindennel egyutt, szerintem ott hibadzik valami.

-------------------------------
“The 0 in Raid 0 stands for how many files you’re going to get back if something goes wrong” :)

Az a sor, amit kerdezel nincs benne, ha benne lenne gondolom tovabb menne a node1 konfiguralasaval.
Eza scinstall.log.11067, amit bemasoltam.

Solaris2-n sikeres volt a telepites, mert a logjaiban (scinstall.log) nem ir hibat. Plusz, ha pl. ujra akarom inditani a teljes cluster installt, akkor a node2-re azt mondja, hogy mar clusterben van.

Szoval... Igazabol azt nem ertem, hogy a node2 reboot utan mi a szarert nem szol vissza a node1-nek, hogy sikeres/sikertelen voltak a beallitasok reboot utan.

Erre odafigyeltél?

Beware the node
which run the scinstall command get the highest
nodeid. The last node in the order list within
scinstall will be nodeid 1

Meg itt ez a sor is:
This node has not yet been booted as a cluster node
A node2-t is be kellene bootolni cluster módba.
Igaz én nem szoktam egyszerre hozzáadni a két node-ot. A node01-en lefuttatom az scinstall-t, majd reboot. Majd a node02-n is lefuttatom az scinstall-t, hogy join-oljon a clusterhez. Majd ezt a node-ot is rebootolom, és ha mind két node cluster módban van, akkor a clsetup-al felveszem a quorum device-t.

--
http://laszlo.co.hu/

Milyen gépen próbáltad? Ma én is belefutottam ebbe a hibába, és kiderült, hogy 32 bites platform nem támogatott.