Ha valamilyen okból újra kell indítanom egy élesben üzemelő szervert ...

Címkék

szoktam aggódni
53% (403 szavazat)
nem szoktam aggódni
25% (190 szavazat)
csak az eredmény érdekel
22% (165 szavazat)
Összes szavazat: 758

Hozzászólások

Tervezett leállás, patchelés, közben az egész cég áll (nincs virtualizáció, vagy cluster), rebootolni kell a production szervert. Elindul? Nem indul? Jaj de hosszan áll le. Mit csinál? El fog indulni? Felpörögnek a diszkek? Vagy sok év után pont most adja meg magát az abajgatás után? :))

--
trey @ gépház

Nem aggodok. Evente frissiteni kell a rendszert, elofordul, hogy surubben ha sulyos hiba van. Az OS stabil, van 8 eve futo rendszer is, oda inkabb nem is lepek be, azt nem is szabad bantanunk. Szerencsere semmi baja.

A ugyfel tud a leallasrol, anelkul nem inditok ujra gepet. A window meg bore szoktam meretezni, igy altalaban mindig van 30-60 perc rahagyas. Amelyik rendszer meg nincs clusterben, az megerdemli, hogy ne fusson.

Mirrorozott root diszk + naplozo fs (megbizhato kitesztelt fs) csodakra kepes.

Multkor mondjuk felcseszte az agyamat egy gep. Megpecseltem, ujrainditas es 30 percig nem adott eletjelet. A konzolt lehuztak rola, 1000km-rol meg nehez. Kiderult, hogy csak preconfiguring packages-nel szoszmotolt. De a 150 gepbol miert pont ennek tartott egyedul ilyen sokaig? Biztos napkitores volt es elferdultek az egyik procin a bitek.

Hát igen, a múltkor az egyik ügyfélnél áramszünet miatt volt egy tervezett leállás. Újraindítás után az egyik fontos szerver el sem akart indulni, pedig szabályosan lett leállítva és le is állt. Leégett benne mindkét tápegység, szóval redundás táp ide vagy Yoda, azóta meglehetősen izzadok az újraindítások alkalmával.
---
Mézi 4Ever!

hazudik, aki azt mondja nem aggódik [főleg ha nincs szervíz proci, vagy éppen nem egy vps volt:D sok km-re az embertől:D:D]

vagy eppen 30 km-re van a pcsaba egy adotoronyban az adott gep.... :D

--
irj egy e-mailt, ha itt barmi hibat talalsz. ^ ^

Miért hazudna? Mi pl. igyekszünk relatív sűrűn (negyedév/félév) újraindítani a gépeket, hogy ne X év után egyszercsak off maradjon. Szóval ha valamiért mégis kell közbenső reboot, akkor elvileg olyan nagy meglepetés nem lehet, főleg hogy többször teszteljük a gépet, hogy feljön-e minden reboot után.

Engem csak az eredmeny erdekel: elindul vagy nem indul......

SPAMtelenül - MX spamszűrő szolgáltatás, ahogyan még sosem próbálta

Attol fugg, van- e remote management (pl. iLO), ha van, akkor kevesbe izzad az ember.

Nekem van gépem, ami 5-6 órán keresztűl "indul". Szóval csak azért izgulok, hogy munkaidő vége előtt elinduljon :)

Vannak olyan szerverek, melyeknek ennyi a normalis bootidejuk. Nalunk van egy teszt gepnek hasznalt AS400, ami bizony 2-3 oran keresztul kaparassza ossze magat, de azert elindul a vegen. Utana meg fut, mint a kisangyal.
--


()=() Ki oda vagyik,
('Y') hol szall a galamb
C . C elszalasztja a
()_() kincset itt alant.

Aki ert hozza, ne kovezzen meg, ez csak blackbox okoskodas: mivel a stuff db alapu filerendszert hasznal, gondolom eloszor bebootol az alap kernel, utana alaposan vegigteszteli az adatbazist, utana vegigteszteli mint fajlrendszert, utana megnezi a rendszerfajlok checksumjait, vegul elkezdi betolteni a rendszert magat. Adott esetben ez akar lassu is lehet, foleg, mivel ugy tudom, a fent emlitett teszt szerver nem eppen a hatalmas vasak egyike.
--


()=() Ki oda vagyik,
('Y') hol szall a galamb
C . C elszalasztja a
()_() kincset itt alant.

Jo neked, en kabe 3 parancsot ismerek az egeszbol, meg be tudok lepni. Anno, meg az elejen, amikor a AS400-as kollega tanitgatott, akkor osszelottem magamnak egy custom menut, abba beleraktam mind az osszes 4 darab parancsot, amire nekem valaha is szuksegem lesz, beraktam default menunek, es ezzel letudtam az egesz szervert. Ami azt illeti, ma mar nem biztos, hogy le tudnam gyartani a menut megint...

Szoval, en eleg noob vagyok ebben a cuccban...
--


()=() Ki oda vagyik,
('Y') hol szall a galamb
C . C elszalasztja a
()_() kincset itt alant.

Ó, én R35-n tanultam programozni a középiskolában. Hüpp... előtörnek az emlékek. Az a gyönyörű mérnöki pult. A bolgár lemezegységek megbízható működése, és a sornyomtató zakatolása. Nem beszélve a kártyalyukasztó gépek hatékonyságáról. Meg eleve a kártyákról, melyeket csak egyszer kellett elejteni, hogy utána órákon át legózhassa össze az ember a programját újra. :-D

Ave, Saabi.

az első gép, amin programoztam, még lyukszalagról töltötte a programját:) az asszisztens kisasszony derékig állt a szalagban, mire bebootolt a gép.
a lyukkártya pedig kiválóan alkalmas jegyzetfüzet gyártására, sarkánál összecsavarozva.
az r55 lemezegységeit eláztatta a szállító, úgyhogy a főnök az asztalra csapott és az r55 végül basf gyártmányú lemezekkel indult el, azokkal nem volt gond.

Újraindítás a legenyhébb, amit egy éles szerverrel tenni szoktam. Amúgy meg egy kérdés számít csak: Emberélet van veszélyben?

Ave, Saabi.

Most rohogsz, de en dolgoztam korhazban, ahol lefagyott a 486SLC+DOS powered lelegeztetogep, mert 6 ev alatt felhalmozodtak a logok a 230MB-s HDD-n, es betelt, es ettol kifagyott a hiperware, amelyik gyujtotte a legzes adatokat...

Meg jo, hogy volt rajta Norton Commander(!), igy egyszeruen letoroltem az egy evnel regebbi logokat... De ez annyira nem vicces, mikozben maszkban + beoltozve probalsz ugykodni es rajonni hogy mi a baj, egy olyan gepen, aminek a tulso vegere paciens van kotve... Mindezt este 11-kor, mikozben a fel korhazi osztaly mogotted all a ketsegbeeses hataran.

-=- Mire a programozó: "Na és szerintetek ki csinálta a káoszt?" -=-

Fére ne érts nem nagyképűsködni akarok, de szerintem egy életfenntartó eszköz esetén arra is kell gondolni, hogy 5 évig ki sem kapcsolják. Ami nem jelenti azt, hogy nem követhet el az ember hibát, és igen bele lehet futni ilyesmibe. Én is csináltam már olyan hibát hogy, egy hétig égett a pofám, bár azon nem múlt emberélet (azért mert nem EÜ-ben dolgozom), csak a minta tönkrement. De egy haláleseti jelentésnél elég gáz, hogy halál oka, hogy megtelt a winchester. Egyébként igen aláírom. Én sem gondoltam volna arra hogy néhány kb-okkal televágok több 100-Mb-ot. Pláne ahogy írod, hogy 3-évente kötelező a szerviz. Jó eséllyel én is elkövettem volna ezt. Az egészségügyben ezekszerint a "hibakeresés" néha emberéletbe kerülhet. Ez már csak ilyen. Viszont még midíg nagyságrendekkel jobb, mintha nem vállalnák be az életmentést, mert mivan ha hibázok....

------
3 fajta matematikus létezik. Aki tud számolni, és aki nem.

1. Nem értelek félre.

2. Cinikusan ironizáltam, és fogalmam sincs, mennyi az annyi.
Hat évig a kutya nem nézett arra a gépre (számomra ez tűnik ki hozzászólásból), nem hiszem, hogy ez normális, és főleg nem egy életmentő berendezésnél.
3. Kezelési útmutató, üzemeltetési, garanciális feltételek nem ismeretesek előttünk, így igazából nem tudjuk, hogy egyáltalán a gyártó, forgalmazó vagy fenntartó hibája lenne ez az apró malőr. Gonosz tippem szerint, a csóró fenntartó (értsd pénztelen kórház) a felelős.

Így őszintén szólva csak hümmögni, hangulatot kelteni, flémelni lehet.
--
http://opensolaris.org/os/project/indiana/
http://www.opera.com/browser/

failover + load balancing nelkul nem futtatunk eles szervert manapsag.

:D ... akkor nagyon szerencsés helyen mozogsz.

Volt olyan fogtechnikus vezetőséggel is dolgom ahol mindenáron lehúzták a raid1 egyik lemezét, mert hogy meg csak, meg minek kettő... mindezt egy új brand szervernél :D ... minden áron akarták, aláírták ... majd rátették a könyvelésüket, készletkezelésüket és ...

az ilyeneknek ugy kell
az ilyet en sem ertettemsoha
megmagyarazza a szakembernek h hogy legyen. aztan ha nem lesz jo vmi - amit persze a szakember elore lat es el is mond - akkro persze a szakember a hibas. hat mit lehet az ilyennel csinalni?
komolyan mondom ha en egy jo nevu tapasztalt rendszergazda lennek, egy az egyben otthagynam az ilyet
csinalja ahogy akarja, vegyen fel egy hentest a pozicioba, annak magyarazzon.
neha ugy bannak az emberrel mintha vmi munkasember lenne, mintha brute force lenne.

keves tapasztalatom van ezen a teren(nagyon keves), de ennyit mar lattam.

Magas labda? :D ... ez olyan lapos volt, hogy még a hálót sem érintette alulról. Kértek a sógortól egy ajánlatot " ... kő egy szörvör vagy mi ..." mer a másik sógor (2) csinál valamit amivel könyvelünk "... vagy mi .. " az küldött hármat, (a sógor 1)megkérdezte tőlem hogy mire kell, majd kiválasztották a legolcsóbbat és észrevették hogy abbó a valami hdd vagy mi kettő van beírva, mert hogy a paraszt nem tudja mi, nekem nem hisz, (a sógor ellentmond nem tőle vesznek) így biztos átvágják, lehúzta az egyiket ... amikor a dobozt megláttam ( a folyamatban először ) hogy mi is van benne, jött pár beszélgetés és aláírattam velük hogy ezért a szarért én ebben a formában semmilyen felsőséget nem vállalok és rátettem a könyvelésüket, majd elkezdtem elhagyni ketyegő hajót amúgy más okból, de annak is hasonló logikája volt :S meg persze én is a féreg voltam hogy csak az amúgy nem kevés pénzüket csak költeni akarom ...

Ahol en vagyok, ott _minden_ duplikalt: switch, router, firewall, bejovo net, sot, meg a load balancer/failover hardver (F5 bigiron) is duplikalva van. A duplikacio persze azt is jelenti, hogy ket kulon teremben vannak, egymastol jo messze.

Amugy nehogy azt hidd, hogy draga. Egy-ket howtot kell elolvasni, es ne feledd, hogy 3 gep kell ugyan (2 worker + 1 load balancer), de egyesevel sokkal gyengebb is eleg, mint egy behemotnak. Viszont nincs SPOF.

Nem feltétlen web vagy internet szerverről van itt szó. Tudok olyan országos áruházláncot, ahol a központi kasszakontroller egy darab ide lemezre telepített Windows SBS szerver... A backup-ot is arra ez egy darab lemezre (igaz a D meghajtóra!!! úgy baj nem lehet) mentik. Hétfőtől vasárnapig vannak nyitva. Leállás szinte megengedhetetlen. És miért nem vesznek komolyabb cejget? Mert a tulajdonos meggyőzhetetlen. Neki azt mondták, hogy ez így jó. Még nem futott bele nagyobb pofonba.

--
trey @ gépház

OFF: bocsi, de legyszi adj valami cimet, amin valaszolsz is, remenytelen teged utolerni. Egyaltalan megkaptad a levelemet? Vagy legalabb engedelyezd a kapcsolati urlapodat, mert nagyon remenytelen a dolog.
--


()=() Ki oda vagyik,
('Y') hol szall a galamb
C . C elszalasztja a
()_() kincset itt alant.

En azert szoktam aggodni, mert a szervereim egy resze tobbszaz km-re van. Ha nem indul el, neha napokba telik, mire ujra menni fognak... Es az baj. A helyi gepeknel nem aggodom.

-=- Mire a programozó: "Na és szerintetek ki csinálta a káoszt?" -=-

Én a helyi gépeknél is szoktam aggódni. Hallottam olyanról (közvetlen környezetemben történt meg valakivel), hogy firmware hibából leállítás után úgy esett szét a RAID tömb, hogy utána nem lehetett összekalapálni. A mai rendszerek méretükből adódóan akkorák már, hogy a backup-ból való visszaállás már csak a fájlmásolás okán is több óra. Persze lehet mondani, hogy "gyerekek, vettetek volna cluster-t", de ez akkor, ott senkit sem fog érdekelni.

Szerencsére nekem még sose volt ilyen személyes tapasztalatom (adatvesztés), de nem is szeretném megélni a szituációt, amikor oda kell menni egy ügyfélhez és be kell közölni, hogy most minden odavan és indul restore procedúra :) Mivel ismerek olyan személyt, aki járt már így önhibáján kívül, tudom, hogy utána minden érv csak magyarázkodásnak látszik vezetői szinten.

--
trey @ gépház

En igazabol helyben nem aggodok. Altalaban olyan szerveeink vannak, melyek regota uzemelnek mar nalunk, tehat a BIOS/firmware nem lehet problema. Kernelcserenel mindig lemegyunk, ha mas van, akkor pedig jo esellyel megint felbootol a gep (ilyen teren a Debian egesz jo).
--


()=() Ki oda vagyik,
('Y') hol szall a galamb
C . C elszalasztja a
()_() kincset itt alant.

Én is jártam már így, úgy, hogy csak egy könyvelő programról volt mentés, mert a cégvezetés úgy gondolta, hogy elég ha csak azt mentjük 1 dvd-re. Szerencsére késő délután történt és sikerült minden adatot visszaállítani, szóval másnap reggel már ment a szerver. 2 nap múlva már volt pénz backupra...

Sokan úgy gondolnak a biztonságra, hogy (amíg nincs baj) csak felesleges kiadás.

Ha valamilyen okból újra kell indítanom egy élesben üzemelő szervert, akkor csak az eredmény érdekel :D

Uhh, ez nagyon gáz.

------
3 fajta matematikus létezik. Aki tud számolni, és aki nem.

Szoktam nyilvan de nem azert hogy juj milesz, mert mennie kell, ha nem akkor meg valaki elb@szott valamit (lehet hogy en) es meg kell javitani. Inkabb azert aggodok hogy ha pont nalam nem indul, akkor nekem van vele + melom. Viszont en elvezem es utana megyek a sracokhoz hogy hoho itt egy patchkabel most valaki le fog hajolni...

Meg kell tudni fixelni gyorsan, aki nem ert hozza ne csinalja. Ha meg valami nagyon elcseszodik akkor eleg parazni.

kthxbye

Nálunk ha fizikai vasat kell újraindítani, ott a para már korábban lement.
__________________________________
2e845cb4c3a5b5bd6508455b1739a8a2

Ha tervezett a leállás (pl a 3 havi újraindítás) akkor nem aggódom. De ha valami frissítés vagy beállítás módosítás miatt kell, akkor azért ott az a fél perc amikor nagyon aggódom.

1.) erre van a DRP (disaster recovery planning)
2.) ha csak a sajat munkamrol lenne szo...
3.) vannak ellenorizheto feltetelek (AIX-en pl bootlist/VG mirror, mksysb vagy TSM backup)
4.) legyen lehetoseg failover-re
5.) a rendszereket be kell sorolni fontossag szerint, es a kritikusakra nagyon ugyelni (az elso termeszetesen maga a backup/archive rendszer!!)
6.) *minden* legyen dokumentalva
7.) ne legyen potolhatatlan ember (ne shell history-bol kelljen rajonni az inditasi procedurara)

Az igazán lazák éjjel, távolról frissítik a szervert aztán nyomnak egy rezsőt is neki ... :D ... vagy Vasárnap du.! S a benne felejtett bootolós CD ilyenkor nagyon fel tudja dobni a napomat! :)