WDC WD10EZEX - javított szektorhibák -kuka, vagy még nem?

Merevlemezek, vezérlők

Adott a következő HDD (WDC WD10EZEX), amin a HDD Sentinel "Lemez javítás (olvasás teszt szektorok javításával)"- nevű kézrátételes gyógyítómódjának többszörös futtatásával sikerült egy rakat 23-as CRC adat hibát javítani, azóta ennek a tesztnek a futtatásával minden szektort jónak jelöl, a színes kis négyzetek változó helyzetekben mutatnak csak sötétebb színeket... A Smart "Current pendig sector count"-ja 0-ra állt vissza, a "Off-line uncorrectable sector count" adat mező tartalma pedig 0-ról 1-re állt.

Nem hiszek a mágiában és nem vagyok idealista sem, a kérdésem: mennyire veszélyes ez a fajta hiba, elzörög még vele ez az öreg masina, vagy sürgősen csere?

és akkor egy kapcsolódó kérdés: helyette wd gold, vagy wd black?

771 megtekintés

Ez egy szubjektív vélemény tőlem: én mindenképp cserélném azt a háttértárat. Nem nyugtat meg a jelenség, az adat és a gép használhatósága fontosabb, mint ezen filléreskedni.

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

1 szavazat

A hozzászóláshoz be kell jelentkezni

jogos, csupán azért kérdezem, hogy azonnal pánik-módba kapcsoljak, vagy azért még bőven ráérek a következő hetekben utánajárni...

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nem bőven. Örülj, hogy még adatvesztés előtt észrevetted, ne élj vissza ezzel az isteni szerencséddel. Labilis a rendszer. Lehet, hogy van benne még 2 év, de az is lehet, hogy csak 5 nap. Vagy annyi sem.

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

3 szavazat

A hozzászóláshoz be kell jelentkezni

Minden a rajta lévő adatok fontosságának, a merevlemez konkrét működési helyének, napi időtartamának, szerepének kérdése. Nekem van, - nem túl fontos gépben és adattárolási céllal, - évek óta szektorhibásan működő "darab". - Folyamatosan mentek róla és hetente ellenőrzöm a smart-ot az esetleges romlás mértékét megállapítandó. Sajnos, használatba vettem új WD-t, már szektorhibás volt 1 nap múlva. Azóta is működik. (Így nem tulajdonítok már nagy jelentőséget a "szektorhiba"-dolognak. - Másrész van RAID tömbben merevlemez ami javítva lett és pár hónapot ismét kibír, de ismét tönkre is megy. Játéknak, - aki szereti az ilyet, - jó. :) )

0 szavazat

A hozzászóláshoz be kell jelentkezni

értem, ez a 2000-es évek "poresznek még jó lesz"-kategóriája.

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

0 szavazat

A hozzászóláshoz be kell jelentkezni

letorrentezni a legujabb ~~film~~isokat jo lehet. :D vagy seed serverbe is jo (ugyis van checksum torrentben szol ha gebasz van).

A vegtelen ciklus is vegeter egyszer, csak kelloen eros hardver kell hozza!

1 szavazat

A hozzászóláshoz be kell jelentkezni

Évekig is használható lehet.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Furcsállom azt a jelenséget, hogy akárhányszor futtatom újra ezt az olvasás-javítás tesztet, mindig máshol vannak a nehézkes kiolvasást jelző sötétebb négyzetek és mintha szaporodna is a számuk. Nem tudom megítélni, mennyire hiteles ez a szoftver annak megítélésében, hogy mi a HDD jelenlegi konkrét és várható jövőbeni állapota.

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

0 szavazat

A hozzászóláshoz be kell jelentkezni

a kábelt kicserélted már?

1 szavazat

A hozzászóláshoz be kell jelentkezni

Jogos, erre nem gondoltam. Érdemes figyelni a márkára, hosszra, vagy nagyjából mindegy?

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nekem a gagyi sata kábel okozott ilyesmit, a windows nem reagálta le, de linux már bootoláskor jelzett különböző crc hibákat.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Duál bootos rendszert használok róla, se a windows, se a linux nem pampogott még.

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

0 szavazat

A hozzászóláshoz be kell jelentkezni

A várható jövőbeni állapotot nem tudom, hogy melyik szoftver tudja megállapítani de a jelenlegi konkrét állapot felméréséhez az MHDD-t vagy a HDAT2-t jobbnak tartom a HD Sentinelnél.

1 szavazat

A hozzászóláshoz be kell jelentkezni

Kábelt fogok cserélni és ellenőrzöm ezekkel is. Azt furcsállom csak egy kicsit, hogy amilyen fejlett technológia jelenleg egy ilyen szerkezet, még mindig csak max. 50%-os pontosságú egy állapotjelentés róla.

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

0 szavazat

A hozzászóláshoz be kell jelentkezni

Pending sector azt jelenti, hogy az elektronika megjelolte mint "cserelni kellene" ilyenkor idonkent olvasgatja a szektort es hibasnak iteli akkor kapsz egy Offline counter emelkedest es szepen a spare teruletbol kezd hasznalni ami minden diszknel van.

Amennyiben nem ms kritikus a dolog akkor kb. nem erdekes kategoria.

Van olyan diszkem ami evekkel ezelott csinalt 300++ ilyen cseret es meg mindig porog, mikozben nullas erteku forgo morgok adtak be a kulcsot mellette.

Tehat ha van backup es vagy nem szamit nemi allasido akkor ez szot sem erdemel kategoria.

Ja es igen, megfeleloen fejlett technologia a kevesbe fejlett megfigyelonek megkulonboztethetetlen a magiatol...

Every single person is a fool, insane, a failure, or a bad person to at least ten people.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ezek szerint volt 1 bad sec, amit a spare-ból javított.

"Ja es igen, megfeleloen fejlett technologia a kevesbe fejlett megfigyelonek megkulonboztethetetlen a magiatol..."

- valóban, a kérdés csak az, hogy pontosan mit tekintünk fejlett technológiának. Egy négyzetszínezgető látványszerviz mögött áll-e valós produktum, vagy csak a parasztvakitás...

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

0 szavazat

A hozzászóláshoz be kell jelentkezni

Pending sector egy szemét dolog. Ez képes magával rántani a Linux szervert, amikor az ráolvas egy ilyenre. Hiába van szoftver RAID1-ben és a másik odaadná az adatot, megfogja a kernel diszk alrendszerét.
Érdekessége: ha újraírod folytonosan a diszket, eltűnik az összes Pending sector.

RAID esetén mdadm segítségével kiveszem a Pending sectoros diszket és visszarakom, hogy mint új diszk rászinkronozza szektorfolytonosan a tartalmat. És ettől megjavul.

0 szavazat

A hozzászóláshoz be kell jelentkezni

"Hiába van szoftver RAID1-ben és a másik odaadná az adatot, megfogja a kernel diszk alrendszerét. "

Ezzel próbáltál játszani:

https://en.wikipedia.org/wiki/Error_recovery_control

"Effectively, TLER and similar features limit the performance of on-drive error handling, to allow hardware RAID controllers and software RAID implementations to handle the error if problematic. "

0 szavazat

A hozzászóláshoz be kell jelentkezni

off

Tessék ezért picit irigyelni engem:

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     31407         -

31407 üzemóra a jelenlegi gépem egyik HDD-jében. Kettő van benne, mert amikor kezdett fogytán lenni a hely, beletettem egy másikat is, és az LVM-et kiterjesztettem arra is. Az oprendszer SSD-n van. Amúgy hülye kiosztásban: sda, sdc a két HDD, rajta LVM-en /home, /var, sima partíción swap, az oprendszer, tehát /, /boot az sdb-n van, ami SSD. Egyébként ezt a megbízhatóságot ez a modell hozta:

Model Family:     Western Digital Caviar Blue (SATA)
Device Model:     WDC WD5000AAKS-00A7B0

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

0 szavazat

A hozzászóláshoz be kell jelentkezni

Én meg vagyok elégedve a Caviar blue-szériával, igaz SMR-példánnyal még nem találkoztam.

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

0 szavazat

A hozzászóláshoz be kell jelentkezni

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%     61462         -

WD20EFRX, otthoni szerverben.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Impozáns, kétszer annyit járattad, mint én. Az enyém desktop gépben van, tehát nem jár napi 24 órában. Napi 8 órában számolva minden nap, közel 11 év, de nyilván nem járt minden nap 8 órát, szóval ennél is idősebb már.

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

0 szavazat

A hozzászóláshoz be kell jelentkezni

Kétesélyes... lehet, még évekig jó, de lehet, holnap adatvesztésed lesz. Én nem kockáztatnék, egyértelműen csere!

( •̀ᴗ•́)╭∩╮

A VMware egy Ferrari, amit a maffiától bérelsz és mindig a hó elején derül ki éppen mennyi lesz a beszedett díj.
A Proxmox megy egy Porsche, ami az F1 motorját kapta meg.
by: jevgenyij

1 szavazat

A hozzászóláshoz be kell jelentkezni

De ez egy vadiúj, hibátlan smart paraméterekkel rendelkező hdd-re is ugyanúgy érvényes. :/

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

3 szavazat

A hozzászóláshoz be kell jelentkezni

Panic vs. Non-panic...

felhasználástól függ. Van olyan hely ahol a legkissebb hibára is megy be helyette a cseredarab a polcról. A @home szervernél viszont tökre nem érdekelne lehet, hogy még nyolc évig is elketyeg. Max a kölykök 1-2 órát csak a netflixen meg az hbon tudnak lógni amíg mentés(ek)ből visszaállítom az adatokat.

Hármas........alá............kettes.........................egyest írtam be.

1 szavazat

A hozzászóláshoz be kell jelentkezni

Van olyan hely ahol a legkisebb hibára is megy be helyette a cseredarab a polcról.

Bónusz, hogy ilyenkor jellemzően még garanciás is :-)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Morcos lennél, ha a folyószámlád egyenlegén lenne bit-flip (ofcoz a rossz irányba :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Van olyan hely, ahol 3 diszkes RAID1-et használok, pazarolva az anyagot. A közelmúltban ott is javítottam távolról pending sectort.
Bár valaki elmagyarázhatná, hogy pontosan mi ez a pending sector és miért tűnik el a teljes felület szektorfolytonos újraírásakor, mert csak amolyan képzeleteim vannak róla. De eddig mindig segített ez a távolról végrehajtható trükk.

Polcról bepattintani az ebben az esetben 6 órás autókázás egy frankó mikrohullámú toronyhoz. Egyébként szép helyen van.

0 szavazat

A hozzászóláshoz be kell jelentkezni

A (mai) diszkeken elég nagy hely van fenntartva a meghibásodott szekorok helyettesítésére.

Ha egy szektor hibásan olvasható, akkor a diszk operációs rendszere megjelöli, mint helyettesítendőt. (ez a pending)

Ha a helyettesítendő szektorra írás történik, akkor átkerül a láthatatlan hibás szektorok közé és a tartalékból kap egy helyettest. Az írás tartalma végül erre az új helyre kerül.

No, ez volt az első osztályos Móricka ismeretterjesztő magyarázat rózsaszín illatos levélpapíron. :-D Amit meg nem írtam ide, az több kötetre rúgna.

Az általad használt javítási módszer nem rossz, de nem is biztonságos. Megadok néhány szempontot, hogy kevesebbet kelljen autóznod. ;)

A diszkhibák javítását lehetőleg offline (az operációs rendszer futását mellőzve) kell elvégezni - kivétel, ha tudod mit csinálsz.
A javításhoz célszerű erre alkalmas szoftvert használni. (SpinRite, HDAT2, MHDD) Létezik rengeteg "low level formatter" (stb.), bár az írójának lila gőze sincs mi az, amit csinál. :(
Ha a diszk vagy annak a hibás területe nincs használatban, és az operációs rendszer is megengedi, akkor lehet online is javítani.
Egy hiba - több hiba önmagában nem probléma. A meghibásodás mértékének megítéléséhez figyelembe kell venni a hibák szaporodásának trendjét és az eszköz korát is. (Lásd mechanikai kopásgörbe: bejáratás, normál üzem, elhasználódás - élettartam vége)

Ezzel vége a következő rózsaszín fejezetnek! A valóságban egyéb esetek is előfordulnak.

Az adatblokkok ellenőrzésére és javítására használt ECC biztosította lehetőségek korlátozottak és benne van a tévedés lehetősége is.
A SMART csak egy tájékoztató rendszer, amiből lehet jósolni is, de sok esetben semmit nem fogunk megtud a diszkről. (Van erről pár tanulmány is.) Hiszen a SMART csak arról tud nyilatkozni, amiről tudomása van.
Minden korábbi megállapítás csak az adatblokkokat érinti! *

* A mai diszkekben az ősrégi hard track és hard sector helyett minden soft - azaz a szervo információ még egy héjat képez az adatblokkok (szektor) körül. Ha az megsérül, akkor nem beszélhetünk adatblokkról, mert bár fizikailag létezik, de a rendszer képtelen megtalálni. (Ilyen esettel találkoztam, amikor egy windows pagefile.sys állományának elejében keletkezett egyetlen azonosíthatatlan szektor. Kivételesen az ok is kiderült: Nagy hidegben szállított gépet még hidegen bekapcsoltak, és ez látszott is a diszk naplójából.)

A másik SMART hatáskörén kívül álló hiba a szervó rendszer kisebb meghibásodása. (Sikerült vásárolnom egy olyan diszket, ami a korábbi modell és egy fejlett szervóval készült modell között készült. Az utolsó 12GB használaton kívülre került, mert ott olyan hangok keletkeztek, mint amikor megrázod a laza drótkerítést. ;))

Magánvélemények: Amit soha nem használok...

HDSentinel: A diszk 97%-os és néhány szektor hibával rendelkezik. Egyébként egyetlen bit adatot sem lehetett olvasni róla, de az első próbálkozástól mindig lefagyott.

Ubuntu: Sikerült a succccesfulll install, csak kernel nem volt a rendszeren. Kétszer is! :)

Viszont láttam már olyan operációs rendszert, amely önállóan kezelte a diszk hibákat: AIX - scsi, de akár idegen diszkekkel.

1 szavazat

A hozzászóláshoz be kell jelentkezni

A pending sector azt jelenti, hogy az oprendszer megpróbálta olvasni az adott szektort, de nem sikerült. A vinyó egy ideig próbálkozik, de végül olvasási hibát jelez vissza. Megjegyzi magának, hogy hibás a szektor, de még nem tudja átirányítani egy tartalék szektorra, mert nem tudja, milyen adat van benne, és ha átirányítaná, az adatvesztéshez vezetne. Két módon derülhet ki a szektor tartalma a vinyó számára: sok-sok próbálkozás után sikerül kiolvasni az adatot, vagy az oprendszer felülírja új adattal. A vinyó mindkét esetben megjelöli hibásnak a szektort, és átirányítja egy tartalékra (reallocated sector). Namost amikor te felülírod az egész vinyót, akkor a hibás szektort is felülírod, és a vinyó el tudja végezni az átirányítást.

1 szavazat

A hozzászóláshoz be kell jelentkezni

Tehát röviden: a HDD Sentinel általam használt funkciója gyakorlatilag ugyanezt a teljes felület újraírást csinálta, csak futó rendszer alól?

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

0 szavazat

A hozzászóláshoz be kell jelentkezni

Köszi a válaszokat (bucko-nak is). Már érdemes volt kérdeznem.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Különbséget kellene tenni az OS általi hibás szektor megjelölés (pl. chkdsk-ben látszódó "bad block") és a HDD/SDD firmware általi szektor megjelölés (SMART attributum: reallocated / pending sector count) között.

0 szavazat

A hozzászóláshoz be kell jelentkezni

WD20EARS - 82684 óra van benne. Reallocated_Sector=9, Current_Pending=1457, Offline_Uncorrectable

az otthoni NAS egyik lába. Temetem már vagy 2 éve. Érdekes, hogy a Synology nem lökte még ki a tömbből.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ha RAID-ben van, akkor ahogy fentebb írtam, vedd ki a tömbből és add hozzá újra. A resync során a Pending sector felszámolódik ahogy szektorfolytonosan végigírod a diszk felületét.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ennek a módszernek azért van némi kockázata.

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

0 szavazat

A hozzászóláshoz be kell jelentkezni

Áh, ez már ilyen állapotban direkt a kuka fele fog kullogni. Az világos, hogy kevés rossz szektornál érdemes újrairatni, aztán kiderül még csinálja e vagy sem.

0 szavazat