WDC WD10EZEX - javított szektorhibák -kuka, vagy még nem?

Adott a következő HDD (WDC WD10EZEX), amin a HDD Sentinel "Lemez javítás (olvasás teszt szektorok javításával)"- nevű kézrátételes gyógyítómódjának többszörös futtatásával sikerült egy rakat 23-as CRC adat hibát javítani, azóta ennek a tesztnek a futtatásával minden szektort jónak jelöl, a színes kis négyzetek változó helyzetekben mutatnak csak sötétebb színeket... A Smart "Current pendig sector count"-ja 0-ra állt vissza, a "Off-line uncorrectable sector count" adat mező tartalma pedig 0-ról 1-re állt.

Nem hiszek a mágiában és nem vagyok idealista sem, a kérdésem: mennyire veszélyes ez a fajta hiba, elzörög még vele ez az öreg masina, vagy sürgősen csere?

--

és akkor egy kapcsolódó kérdés: helyette wd gold, vagy wd black?

Hozzászólások

Ez egy szubjektív vélemény tőlem: én mindenképp cserélném azt a háttértárat. Nem nyugtat meg a jelenség, az adat és a gép használhatósága fontosabb, mint ezen filléreskedni.

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

Szerkesztve: 2020. 08. 01., szo – 14:49

Minden a rajta lévő adatok fontosságának, a merevlemez konkrét működési helyének, napi időtartamának, szerepének kérdése. Nekem van, - nem túl fontos gépben és adattárolási céllal, - évek óta szektorhibásan működő "darab". - Folyamatosan mentek róla és hetente ellenőrzöm a smart-ot az esetleges romlás mértékét megállapítandó. Sajnos, használatba vettem új WD-t, már szektorhibás volt 1 nap múlva. Azóta is működik. (Így nem tulajdonítok már nagy jelentőséget a "szektorhiba"-dolognak. - Másrész van RAID tömbben merevlemez ami javítva lett és pár hónapot ismét kibír, de ismét tönkre is megy. Játéknak, - aki szereti az ilyet, - jó. :) )

Furcsállom azt a jelenséget, hogy akárhányszor futtatom újra ezt az olvasás-javítás tesztet, mindig máshol vannak a nehézkes kiolvasást jelző sötétebb négyzetek és mintha szaporodna is a számuk. Nem tudom megítélni, mennyire hiteles ez a szoftver annak megítélésében, hogy mi a HDD jelenlegi konkrét és várható jövőbeni állapota.

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

Kábelt fogok cserélni és ellenőrzöm ezekkel is. Azt furcsállom csak egy kicsit, hogy amilyen fejlett technológia jelenleg egy ilyen szerkezet, még mindig csak max. 50%-os pontosságú egy állapotjelentés róla. 

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

Szerkesztve: 2020. 08. 01., szo – 15:14

Pending sector azt jelenti, hogy az elektronika megjelolte mint "cserelni kellene" ilyenkor idonkent olvasgatja a szektort es hibasnak iteli akkor kapsz egy Offline counter emelkedest es szepen a spare teruletbol kezd hasznalni ami minden diszknel van.

Amennyiben nem ms kritikus a dolog akkor kb. nem erdekes kategoria.

Van olyan diszkem ami evekkel ezelott csinalt 300++ ilyen cseret es meg mindig porog, mikozben nullas erteku forgo morgok adtak be a kulcsot mellette.

Tehat ha van backup es vagy nem szamit nemi allasido akkor ez szot sem erdemel kategoria.

 

Ja es igen, megfeleloen fejlett technologia a kevesbe fejlett megfigyelonek megkulonboztethetetlen a magiatol...

Every single person is a fool, insane, a failure, or a bad person to at least ten people.

Ezek szerint volt 1 bad sec, amit a spare-ból javított. 

"Ja es igen, megfeleloen fejlett technologia a kevesbe fejlett megfigyelonek megkulonboztethetetlen a magiatol..."

- valóban, a kérdés csak az, hogy pontosan mit tekintünk fejlett technológiának. Egy négyzetszínezgető látványszerviz mögött áll-e valós produktum, vagy csak a parasztvakitás... 

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

Pending sector egy szemét dolog. Ez képes magával rántani a Linux szervert, amikor az ráolvas egy ilyenre. Hiába van szoftver RAID1-ben és a másik odaadná az adatot, megfogja a kernel diszk alrendszerét.
Érdekessége: ha újraírod folytonosan a diszket, eltűnik az összes Pending sector.

RAID esetén mdadm segítségével kiveszem a Pending sectoros diszket és visszarakom, hogy mint új diszk rászinkronozza szektorfolytonosan a tartalmat. És ettől megjavul.

"Hiába van szoftver RAID1-ben és a másik odaadná az adatot, megfogja a kernel diszk alrendszerét. "

 

Ezzel próbáltál játszani:

https://en.wikipedia.org/wiki/Error_recovery_control

"Effectively, TLER and similar features limit the performance of on-drive error handling, to allow hardware RAID controllers and software RAID implementations to handle the error if problematic. "

off

Tessék ezért picit irigyelni engem:

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     31407         -

31407 üzemóra a jelenlegi gépem egyik HDD-jében. Kettő van benne, mert amikor kezdett fogytán lenni a hely, beletettem egy másikat is, és az LVM-et kiterjesztettem arra is. Az oprendszer SSD-n van. Amúgy hülye kiosztásban: sda, sdc a két HDD, rajta LVM-en /home, /var, sima partíción swap, az oprendszer, tehát /, /boot az sdb-n van, ami SSD. Egyébként ezt a megbízhatóságot ez a modell hozta:

Model Family:     Western Digital Caviar Blue (SATA)
Device Model:     WDC WD5000AAKS-00A7B0

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

Impozáns, kétszer annyit járattad, mint én. Az enyém desktop gépben van, tehát nem jár napi 24 órában. Napi 8 órában számolva minden nap, közel 11 év, de nyilván nem járt minden nap 8 órát, szóval ennél is idősebb már.

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

Kétesélyes... lehet, még évekig jó, de lehet, holnap adatvesztésed lesz. Én nem kockáztatnék, egyértelműen csere!

( •̀ᴗ•́)╭∩╮

"speciel a blockchain igenis hogy jó megoldás, ezért nagy erőkkel keressük hozzá a problémát"

"A picsat, az internet a porno es a macskas kepek tarolorandszere! : HJ"

Panic vs. Non-panic...

felhasználástól függ. Van olyan hely ahol a legkissebb hibára is megy be helyette a cseredarab a polcról. A @home szervernél viszont tökre nem érdekelne lehet, hogy még nyolc évig is elketyeg. Max a kölykök 1-2 órát csak a netflixen meg az hbon tudnak lógni amíg mentés(ek)ből visszaállítom az adatokat.

Hármas........alá............kettes.........................egyest írtam be.

Van olyan hely, ahol 3 diszkes RAID1-et használok, pazarolva az anyagot. A közelmúltban ott is javítottam távolról pending sectort.
Bár valaki elmagyarázhatná, hogy pontosan mi ez a pending sector és miért tűnik el a teljes felület szektorfolytonos újraírásakor, mert csak amolyan képzeleteim vannak róla. De eddig mindig segített ez a távolról végrehajtható trükk.

Polcról bepattintani az ebben az esetben 6 órás autókázás egy frankó mikrohullámú toronyhoz. Egyébként szép helyen van.

A (mai) diszkeken elég nagy hely van fenntartva a meghibásodott szekorok helyettesítésére.

Ha egy szektor hibásan olvasható, akkor a diszk operációs rendszere megjelöli, mint helyettesítendőt. (ez a pending)

Ha a helyettesítendő szektorra írás történik, akkor átkerül a láthatatlan hibás szektorok közé és a tartalékból kap egy helyettest. Az írás tartalma végül erre az új helyre kerül.

No, ez volt az első osztályos Móricka ismeretterjesztő magyarázat rózsaszín illatos levélpapíron. :-D Amit meg nem írtam ide, az több kötetre rúgna.

Az általad használt javítási módszer nem rossz, de nem is biztonságos. Megadok néhány szempontot, hogy kevesebbet kelljen autóznod. ;)

  • A diszkhibák javítását lehetőleg offline (az operációs rendszer futását mellőzve) kell elvégezni - kivétel, ha tudod mit csinálsz.
  • A javításhoz célszerű erre alkalmas szoftvert használni. (SpinRite, HDAT2, MHDD) Létezik rengeteg "low level formatter" (stb.), bár az írójának lila gőze sincs mi az, amit csinál. :(
  • Ha a diszk vagy annak a hibás területe nincs használatban, és az operációs rendszer is megengedi, akkor lehet online is javítani.
  • Egy hiba - több hiba önmagában nem probléma. A meghibásodás mértékének megítéléséhez figyelembe kell venni a hibák szaporodásának trendjét és az eszköz korát is. (Lásd mechanikai kopásgörbe: bejáratás, normál üzem, elhasználódás - élettartam vége)

Ezzel vége a következő rózsaszín fejezetnek! A valóságban egyéb esetek is előfordulnak.

  • Az adatblokkok ellenőrzésére és javítására használt ECC biztosította lehetőségek korlátozottak és benne van a tévedés lehetősége is.
  • A SMART csak egy tájékoztató rendszer, amiből lehet jósolni is, de sok esetben semmit nem fogunk megtud a diszkről. (Van erről pár tanulmány is.) Hiszen a SMART csak arról tud nyilatkozni, amiről tudomása van.
  • Minden korábbi megállapítás csak az adatblokkokat érinti! *

* A mai diszkekben az ősrégi hard track és hard sector helyett minden soft - azaz a szervo információ még egy héjat képez az adatblokkok (szektor) körül. Ha az megsérül, akkor nem beszélhetünk adatblokkról, mert bár fizikailag létezik, de a rendszer képtelen megtalálni. (Ilyen esettel találkoztam, amikor egy windows pagefile.sys állományának elejében keletkezett egyetlen azonosíthatatlan szektor. Kivételesen az ok is kiderült: Nagy hidegben szállított gépet még hidegen bekapcsoltak, és ez látszott is a diszk naplójából.)

A másik SMART hatáskörén kívül álló hiba a szervó rendszer kisebb meghibásodása. (Sikerült vásárolnom egy olyan diszket, ami a korábbi modell és egy fejlett szervóval készült modell között készült. Az utolsó 12GB használaton kívülre került, mert ott olyan hangok keletkeztek, mint amikor megrázod a laza drótkerítést. ;))

Magánvélemények: Amit soha nem használok...

HDSentinel: A diszk 97%-os és néhány szektor hibával rendelkezik. Egyébként egyetlen bit adatot sem lehetett olvasni róla, de az első próbálkozástól mindig lefagyott.

Ubuntu: Sikerült a succccesfulll install, csak kernel nem volt a rendszeren. Kétszer is! :)

Viszont láttam már olyan operációs rendszert, amely önállóan kezelte a diszk hibákat: AIX - scsi, de akár idegen diszkekkel.

A pending sector azt jelenti, hogy az oprendszer megpróbálta olvasni az adott szektort, de nem sikerült. A vinyó egy ideig próbálkozik, de végül olvasási hibát jelez vissza. Megjegyzi magának, hogy hibás a szektor, de még nem tudja átirányítani egy tartalék szektorra, mert nem tudja, milyen adat van benne, és ha átirányítaná, az adatvesztéshez vezetne. Két módon derülhet ki a szektor tartalma a vinyó számára: sok-sok próbálkozás után sikerül kiolvasni az adatot, vagy az oprendszer felülírja új adattal. A vinyó mindkét esetben megjelöli hibásnak a szektort, és átirányítja egy tartalékra (reallocated sector). Namost amikor te felülírod az egész vinyót, akkor a hibás szektort is felülírod, és a vinyó el tudja végezni az átirányítást.

WD20EARS - 82684 óra van benne. Reallocated_Sector=9, Current_Pending=1457, Offline_Uncorrectable

az otthoni NAS egyik lába. Temetem már vagy 2 éve. Érdekes, hogy a Synology nem lökte még ki a tömbből.