Sziasztok!
A következő lenne a kérdésem:
Felraktam a Pacemakert(forrásból) plusz a Corosync(szintén forrásból)-et. A következő üzenetet kapom a crm status parancs után
Current DC: NONE
0 Nodes configured
0 Resources configured
A corosync.conf is be van állítva normálisan
totem {
version: 2
# How long before declaring a token lost (ms)
token: 10000
# How many token retransmits before forming a new configuration
token_retransmits_before_loss_const: 10
# How long to wait for join messages in the membership protocol (ms)
join: 1000
# How long to wait for consensus to be achieved before starting a new round of membership configuration (ms)
consensus: 7500
# Turn off the virtual synchrony filter
vsftype: none
# Number of messages that may be sent by one processor on receipt of the token
max_messages: 20
# Limit generated nodeids to 31-bits (positive signed integers)
clear_node_high_bit: yes
# Disable encryption
secauth: on
# How many threads to use for encryption/decryption
threads: 0
# Optionally assign a fixed node id (integer)
# nodeid: 1234
# This specifies the mode of redundant ring, which may be none, active, or passive.
rrp_mode: none
interface {
# The following values need to be set based on your environment
ringnumber: 0
bindnetaddr: 192.x.x.0
mcastaddr: 239.x.x.2
mcastport: 5405
ttl: 1
}
}
amf {
mode: disabled
}
service {
# Load the Pacemaker Cluster Resource Manager
ver: 0
name: pacemaker
}
aisexec {
user: root
group: root
}
logging {
fileline: on
to_stderr: yes
to_logfile: yes
logfile: /var/log/cluster/corosync.log
to_syslog: yes
syslog_facility: daemon
debug: on
timestamp: on
logger_subsys {
subsys: AMF
debug: on
tags: enter|leave|trace1|trace2|trace3|trace4|trace6
}
}
Miért nem látja még magát sem? Mi lehet a gond? Válaszotok előre is köszönöm! :)
Hozzászólások
Indítsd el a pacemaker-t.
Fut a pacemaker illetve a corosync is!
Mit logol a pacemaker indulás után?
Corosync log:
https://drive.google.com/file/d/0B1aQdzC5352QMnJMZ2stNG5tSFE/view
Pacemaker log:
https://drive.google.com/file/d/0B1aQdzC5352QR19aU21JWm1qd0k/view
és restart mindenre. Változik valami?
Holnap megpróbálom! Majd írom az infót!:) Köszi!:)
Köszi szépen, így már látja végre magát! De még egymást nem sajnos.
Ez mit mond?
crm_verify -L -V
error: unpack_resources: Resource start-up disabled since no STONITH resources have been defined
error: unpack_resources: Either configure some or disable STONITH with the stonith-enabled option
error: unpack_resources: NOTE: Clusters with shared data need STONITH to ensure data integrity
Igazából 2 node-hoz nem kell Stonith így azt kikapcsoltam, de még mindig u.a a probléma.
2 node-hoz élesben pont kéne, de amúgy kíváncsi leszek, mi lesz a megoldás.
Mind a két Node-t újból indítottam és megoldódott a gond. Valami összeakadhatott, de attól függetlenül elég érdekes a probléma.... Köszönöm a segítséget mindenkinek!
Első körben tcpdump mindkét gépen, a multicast-tal néha van szívás.
Kommunikálnak elég szépen egymással a NODE-k!
És ilyenkor jön a kérdés, hogy mi van a logban?
Semmi hibát nem ír a log.
Bocs nem olvastam végig a konfigot, ezért csak így beleugatok, hogy könnyen le lehessen oltani. Meg amúgy is offtopic vagyok. De miért nem keepalived?
Pacemaker kicsit szofisztikáltabb, azzal gyakorlatilag bármit üzemeltethetsz clusteben (aktiv-passzívban legalábbis).
Pacemaker is application agnostic, meaning anything that can be scripted can be made highly available
Keepalived tudtomal "csak" vrrp+VIP cím.
Egy konkrét, gyakorlati példát tudnál mondani, amikor nem elég a sokkkal "lightweight-ebb" keepalived? (Aminek egyik erőssége épp az eseményvezérelt shellscriptelés.)
Konkrétan használtuk egy csomó service active-passive HA megoldásához, pl. ahhoz, hogy zabbix-server a clusteren belül csak egy node-on fusson. Meg pl. hogy a zabbix a VIP cím után induljun el, ez egy egyszerű order szabály a pacemakerben, nem kell hozzá semmit scriptelni.
Köszi de úgy értettem a kérdést, hogy tudsz-e egy olyan komplex példát írni, amit már nem lehet v. nem célszerű keepalived-vel megcsinálni - amit írtál, az VIP failovernél service stop/start, a script hiánya miatt kedvezőbbnek tűnik, de nem győzött meg.