99.9999% (x)

 ( hup | 2019. május 28., kedd - 12:37 )

Ennyi a rendelkezésre állási aránya a HPE legújabb storage megoldásának, a Nimble-nek. Hamarosan élőben is kipróbálhatja az emögött rejlő technológiát a Nimble Demo Day rendezvényen. További részletek »

Hozzászólás megjelenítési lehetőségek

A választott hozzászólás megjelenítési mód a „Beállítás” gombbal rögzíthető.

Eleg meresz allitas.
Bizonyitottan nincs benne SW/FW hiba?

Egy ismerős mesélte (igaz, nem ma volt), hogy a HP storage-on FW frissítést végeztek a mérnökök (nem lesz leállás!).
Elbootolták a standby node-ot, frissült rajta a FW. Kiírt valamit a diszkekre, vagy a cluster kommunikációval megborította a másik node-ot, így a szolgáltatásnak annyi volt.
A végére szépen bebootolt mindkettő az új FW-rel, és lett is hirtelen sokszáz TB hely....
... mivel minden LUN-t elvesztett, szűz területként mutatva az összes tárhelyet.

Kicsit tanakodtak felette, majd jött a kérdés, hogy kinek milyen LUN-jai voltak, mert akkor megcsinálnák őket, és utána lehet mentésből visszaállni. :)

Ettől szép ez a szakma. Meg ilyenkor szoktam fogni a fejem.

- "Akkor jönnek megcsinálni a firmware frissítést?
- "Teljes, működőképes, lepróbált mentés van a rendszerről? Mert adatokért felelősséget nem vállalunk."
- "Nincs, de úgyis RAID-en vannak, nem?"

Ja, azon bazmeg. Mert a RAID egy mentés. Mint tudjuk.

--
trey @ gépház

Ha nincs mentes, akkor nem is volt fontos. Fogjatok fel affele e-lomtalanitaskent. :)

Hál' istennek - lekopogom - soha nem volt még adatvesztésben részem. És idén lesz szeptemberben 20 éve annak, hogy ezt csinálom (hivatásszerűen).

--
trey @ gépház

Ami késik - közeledik...

Természetesen tisztában vagyok azzal, hogy amellett, hogy minden ilyennek már-már túlzott óvatossággal állok neki, bármikor be lehet cumizni. Akár olyan külső tényezők miatt is, amit nem lehet kivédeni (pl. gyári firmware bug).

Az egészséges parának ott kell lenni mindenkiben, aki ilyenhez eszközökhöz nyúl.

--
trey @ gépház

Nekem a szakmai éveim 18. fordulója körül volt egy esetem, amikor majdnem elvesztettem egy közel 20 éves fájlt, de végül egy régi mentésnek köszönhetően meglett. Hiába akármi, beszophatod külső okok miatt is, ahogy már te is írtad!

Örülj, hogy eddig jó volt a széljárás! Ekkora múlttal már magad előtt is blama lenne.

--
Where do you want to go today?
[nobody@salcay:~]$_

Mint írtam, számos külső körülmény miatt is lehet adatvesztésed. Nem hinném, hogy ha te mindent megtettél annak érdekében, hogy ne legyen, de mégis bekövetkezik (firmware hiba, bugos mentőszoftver, bugos driver), az neked lenne blama magad előtt.

Ha hangsúly a "megtettél mindent"-en van.

--
trey @ gépház

IBM storage szervereken egy FW frissitessel elkuldtek aludni nalunk a fel datacentert es kb 20-30 csatolt szolgaltatast is sikerult legyilkolni az ugy kapcsan. Es itt nem az a gaz ilyenkor ,hogy nincs meg az adat mert az megvan mentesbol hanem az a gaz ,hogy ez olyan merteku szolgaltatas "kiesest" okoz (pl rendszerleallas alatt a secondary rendszeren erkezett be a sok megrendeles amit mi hetekig takoltunk azutan ,hogy nap vegere ment a status report ,hogy minden mukodik es zold.) ami olyan mennyisegu kp elegeteset jelenti ,hogy az szabad szemmel kb 3 kilometerrol is latszana :( De az adat megvan hurra Anyjuk picsaja...

Ezért is írtam, hogy nekem nem volt adatvesztésben részem. Ha az adatvesztés amiatt keletkezett, mert más fasz volt, az az ő adatvesztése. Pl. a rendszer tulajdonosa időben értesül arról, hogy a rendszere degraded állapotban van és gondoskodni kellene alkatrészről, de tegnapra, ha már volt olyan felelőtlen, hogy nem képzett tartalékot (mert minek az), az az ő adatvesztése lesz. A post mortem jelentésben szerepelni fog, hogy kinek a felelőssége miatt következett be az esemény.

Nyilvánvalóan, "fasz nélkül baszni" nem lehet, így ha egy degraded rendszerhez nincs alkatrészem, hogy cseréljem, akkor max. egy marék jókívánsággal és egy biztató kézfogással tudom a probléma megoldását előmozdítani. Nyilvánvalóan nem tudok pl. SAS diszket, SSD-t stb. gyártani vagy szülni, de azt sem hiszem, hogy nekem kellene a saját pénzemből megvenni, hogy az ügyfél elégedett legyen.

--
trey @ gépház

Ez igaz egy bizonyos meretig. De mondjuk megnezem, hogy 455PB-ot hova mentesz le. Ez volt a legnagyobb ismert hdfs storage merete 5 evvel ezelott a Yahoonal, ami valoszinuleg nem lett kevesebb.

(kicsit santit a pelda, mert a hdfs-ben van nemi :) redundancia, es 5 eve meg biztos nem hasznaltak az erasure codingot, de akkor is egy file system az egesz)

-
First impressions of the new Cloud Native programming language Ballerina

Oke, majd ha 455PB adat lesz a cegeteknel, akkor adok arra is tanacsot, de az mar penzbe fog kerulni. :)

De azonos lokacioban nem er, az nem backup ;)

-
First impressions of the new Cloud Native programming language Ballerina

Azt nem mondtam, hogy olcso lesz. :D

És azt se, hogy gyors... :-D

+1, RAID tükörrel sikerült már érdekeset alkotni az akkori hápé szakembereinek, a bécsi kiemelt ügyfelek támogatóközpont közreműködésével: szerverben az OS tükrözött diszken, dobálta a hibákat, hogy az egyik diszk döglődik. Előre egyeztetett időben megjelent a mérnök a cserediszkkel, és elkezdte a diszkcserét a "szokásos" eljárás szerint, aztán hogy, hogy nem, de a vége egy hápux újratelepítés (és adatok visszatöltése), meg egy emlékezetes post mortem jelentés lett.

Pécs?

Budapest :)

O yeah.... volt nekem mar beuzemeles kozben midplane csere, aztan honapokon at osszes FRU csere... :D
eljen a 3PAR

Pont múlt héten fosott be egy Nimble FW upgrade közben/után. A titkosított volume-okkal gyűlt meg a baja. Support workaroundja: frissítés előtt kapcsoljuk ki a titkosítást.

Amúgy mi a búbánatos lószarnak titkosítani a volume-okat egy ilyen eszközben? Rendes adattolvaj viszi az egész dobozt, hiszen egy szál diszket hiába visz, azon max. egy adattöredék lehet.

2 fő okból:
- Tudod gariztatni a lemezt, nem kell plusz pénzt fizetned, hogy ne add vissza a gyártónak.
- SSD-k esetén picit "nehezebb" az adatok biztos törlése.

Mert ez a policy. Azt, hogy miért találták ki nem az én dolgom és nem is érdekel.

PCI-DSS-nek így a legkönnyebb megfelelni.

AWWW... vinnyogtam a rohogestol mikor beallit az MNB azd mondva h adj kiraly adatot, vagy masolunk magunknak diszket......
trey tan tudja hogy mukodik belulrol a 3PAR :D

HP = Hagyjuk a Picsába.

biztos csak régi sérelmek/tapasztalatok miatt, de ez bennem maradt.

Disclaimer: I am not speaking on behalf of my employer, this is my personal opinion
--
zrubi.hu

HP = házipálesz. :-D

HP = Hülye Picsa :D

+1
:P

félig off:
melyik vendornak volt vmelyik magyar közigazgatási rendszerben storage ledöglése 2-3 éve, firmware bug miatti adatvesztésből fakadóan? Itt a hup-on olvastam róla egy insider-es blogposztját.
Senki nem emlékszik már rá? Tényleg érdekel!
--

HAT darab kilences ? Meeer igen. 2000 kornyeken volt a "five nines, five minutes" szlogen a HP-nal, az se jott be; ez meg egy perc alatti leallasi idot iger egy evre ? Ki az a lagyagyu balfasz, aki ezt elhiszi ?

Mint amikor a villanyszerelo kialtja el magat az intenziv osztalyon:
- Emberek, nagy levego, biztositekcsere !