Adott a következő HDD (WDC WD10EZEX), amin a HDD Sentinel "Lemez javítás (olvasás teszt szektorok javításával)"- nevű kézrátételes gyógyítómódjának többszörös futtatásával sikerült egy rakat 23-as CRC adat hibát javítani, azóta ennek a tesztnek a futtatásával minden szektort jónak jelöl, a színes kis négyzetek változó helyzetekben mutatnak csak sötétebb színeket... A Smart "Current pendig sector count"-ja 0-ra állt vissza, a "Off-line uncorrectable sector count" adat mező tartalma pedig 0-ról 1-re állt.
Nem hiszek a mágiában és nem vagyok idealista sem, a kérdésem: mennyire veszélyes ez a fajta hiba, elzörög még vele ez az öreg masina, vagy sürgősen csere?
--
és akkor egy kapcsolódó kérdés: helyette wd gold, vagy wd black?
- 766 megtekintés
Hozzászólások
Ez egy szubjektív vélemény tőlem: én mindenképp cserélném azt a háttértárat. Nem nyugtat meg a jelenség, az adat és a gép használhatósága fontosabb, mint ezen filléreskedni.
tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE
- A hozzászóláshoz be kell jelentkezni
jogos, csupán azért kérdezem, hogy azonnal pánik-módba kapcsoljak, vagy azért még bőven ráérek a következő hetekben utánajárni...
"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség
- A hozzászóláshoz be kell jelentkezni
Nem bőven. Örülj, hogy még adatvesztés előtt észrevetted, ne élj vissza ezzel az isteni szerencséddel. Labilis a rendszer. Lehet, hogy van benne még 2 év, de az is lehet, hogy csak 5 nap. Vagy annyi sem.
tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE
- A hozzászóláshoz be kell jelentkezni
Minden a rajta lévő adatok fontosságának, a merevlemez konkrét működési helyének, napi időtartamának, szerepének kérdése. Nekem van, - nem túl fontos gépben és adattárolási céllal, - évek óta szektorhibásan működő "darab". - Folyamatosan mentek róla és hetente ellenőrzöm a smart-ot az esetleges romlás mértékét megállapítandó. Sajnos, használatba vettem új WD-t, már szektorhibás volt 1 nap múlva. Azóta is működik. (Így nem tulajdonítok már nagy jelentőséget a "szektorhiba"-dolognak. - Másrész van RAID tömbben merevlemez ami javítva lett és pár hónapot ismét kibír, de ismét tönkre is megy. Játéknak, - aki szereti az ilyet, - jó. :) )
- A hozzászóláshoz be kell jelentkezni
értem, ez a 2000-es évek "poresznek még jó lesz"-kategóriája.
"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség
- A hozzászóláshoz be kell jelentkezni
letorrentezni a legujabb filmisokat jo lehet. :D vagy seed serverbe is jo (ugyis van checksum torrentben szol ha gebasz van).
A vegtelen ciklus is vegeter egyszer, csak kelloen eros hardver kell hozza!
- A hozzászóláshoz be kell jelentkezni
Évekig is használható lehet.
- A hozzászóláshoz be kell jelentkezni
Furcsállom azt a jelenséget, hogy akárhányszor futtatom újra ezt az olvasás-javítás tesztet, mindig máshol vannak a nehézkes kiolvasást jelző sötétebb négyzetek és mintha szaporodna is a számuk. Nem tudom megítélni, mennyire hiteles ez a szoftver annak megítélésében, hogy mi a HDD jelenlegi konkrét és várható jövőbeni állapota.
"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség
- A hozzászóláshoz be kell jelentkezni
a kábelt kicserélted már?
- A hozzászóláshoz be kell jelentkezni
Jogos, erre nem gondoltam. Érdemes figyelni a márkára, hosszra, vagy nagyjából mindegy?
"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség
- A hozzászóláshoz be kell jelentkezni
Nekem a gagyi sata kábel okozott ilyesmit, a windows nem reagálta le, de linux már bootoláskor jelzett különböző crc hibákat.
- A hozzászóláshoz be kell jelentkezni
Duál bootos rendszert használok róla, se a windows, se a linux nem pampogott még.
"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség
- A hozzászóláshoz be kell jelentkezni
A várható jövőbeni állapotot nem tudom, hogy melyik szoftver tudja megállapítani de a jelenlegi konkrét állapot felméréséhez az MHDD-t vagy a HDAT2-t jobbnak tartom a HD Sentinelnél.
- A hozzászóláshoz be kell jelentkezni
Kábelt fogok cserélni és ellenőrzöm ezekkel is. Azt furcsállom csak egy kicsit, hogy amilyen fejlett technológia jelenleg egy ilyen szerkezet, még mindig csak max. 50%-os pontosságú egy állapotjelentés róla.
"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség
- A hozzászóláshoz be kell jelentkezni
Pending sector azt jelenti, hogy az elektronika megjelolte mint "cserelni kellene" ilyenkor idonkent olvasgatja a szektort es hibasnak iteli akkor kapsz egy Offline counter emelkedest es szepen a spare teruletbol kezd hasznalni ami minden diszknel van.
Amennyiben nem ms kritikus a dolog akkor kb. nem erdekes kategoria.
Van olyan diszkem ami evekkel ezelott csinalt 300++ ilyen cseret es meg mindig porog, mikozben nullas erteku forgo morgok adtak be a kulcsot mellette.
Tehat ha van backup es vagy nem szamit nemi allasido akkor ez szot sem erdemel kategoria.
Ja es igen, megfeleloen fejlett technologia a kevesbe fejlett megfigyelonek megkulonboztethetetlen a magiatol...
Every single person is a fool, insane, a failure, or a bad person to at least ten people.
- A hozzászóláshoz be kell jelentkezni
Ezek szerint volt 1 bad sec, amit a spare-ból javított.
"Ja es igen, megfeleloen fejlett technologia a kevesbe fejlett megfigyelonek megkulonboztethetetlen a magiatol..."
- valóban, a kérdés csak az, hogy pontosan mit tekintünk fejlett technológiának. Egy négyzetszínezgető látványszerviz mögött áll-e valós produktum, vagy csak a parasztvakitás...
"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség
- A hozzászóláshoz be kell jelentkezni
Pending sector egy szemét dolog. Ez képes magával rántani a Linux szervert, amikor az ráolvas egy ilyenre. Hiába van szoftver RAID1-ben és a másik odaadná az adatot, megfogja a kernel diszk alrendszerét.
Érdekessége: ha újraírod folytonosan a diszket, eltűnik az összes Pending sector.
RAID esetén mdadm segítségével kiveszem a Pending sectoros diszket és visszarakom, hogy mint új diszk rászinkronozza szektorfolytonosan a tartalmat. És ettől megjavul.
- A hozzászóláshoz be kell jelentkezni
"Hiába van szoftver RAID1-ben és a másik odaadná az adatot, megfogja a kernel diszk alrendszerét. "
Ezzel próbáltál játszani:
https://en.wikipedia.org/wiki/Error_recovery_control
"Effectively, TLER and similar features limit the performance of on-drive error handling, to allow hardware RAID controllers and software RAID implementations to handle the error if problematic. "
- A hozzászóláshoz be kell jelentkezni
off
Tessék ezért picit irigyelni engem:
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 31407 -
31407 üzemóra a jelenlegi gépem egyik HDD-jében. Kettő van benne, mert amikor kezdett fogytán lenni a hely, beletettem egy másikat is, és az LVM-et kiterjesztettem arra is. Az oprendszer SSD-n van. Amúgy hülye kiosztásban: sda, sdc a két HDD, rajta LVM-en /home, /var, sima partíción swap, az oprendszer, tehát /, /boot az sdb-n van, ami SSD. Egyébként ezt a megbízhatóságot ez a modell hozta:
Model Family: Western Digital Caviar Blue (SATA)
Device Model: WDC WD5000AAKS-00A7B0
tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE
- A hozzászóláshoz be kell jelentkezni
Én meg vagyok elégedve a Caviar blue-szériával, igaz SMR-példánnyal még nem találkoztam.
"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség
- A hozzászóláshoz be kell jelentkezni
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed without error 00% 61462 -
WD20EFRX, otthoni szerverben.
- A hozzászóláshoz be kell jelentkezni
Impozáns, kétszer annyit járattad, mint én. Az enyém desktop gépben van, tehát nem jár napi 24 órában. Napi 8 órában számolva minden nap, közel 11 év, de nyilván nem járt minden nap 8 órát, szóval ennél is idősebb már.
tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE
- A hozzászóláshoz be kell jelentkezni
Kétesélyes... lehet, még évekig jó, de lehet, holnap adatvesztésed lesz. Én nem kockáztatnék, egyértelműen csere!
( •̀ᴗ•́)╭∩╮
"speciel a blockchain igenis hogy jó megoldás, ezért nagy erőkkel keressük hozzá a problémát"
"A picsat, az internet a porno es a macskas kepek tarolorandszere! : HJ"
Az élet ott kezdődik, amikor rájössz, hogy szart sem kell bizonyítanod senkinek
Ha meg akarod nevettetni Istent, készíts tervet!
- A hozzászóláshoz be kell jelentkezni
De ez egy vadiúj, hibátlan smart paraméterekkel rendelkező hdd-re is ugyanúgy érvényes. :/
"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség
- A hozzászóláshoz be kell jelentkezni
Panic vs. Non-panic...
felhasználástól függ. Van olyan hely ahol a legkissebb hibára is megy be helyette a cseredarab a polcról. A @home szervernél viszont tökre nem érdekelne lehet, hogy még nyolc évig is elketyeg. Max a kölykök 1-2 órát csak a netflixen meg az hbon tudnak lógni amíg mentés(ek)ből visszaállítom az adatokat.
Hármas........alá............kettes.........................egyest írtam be.
- A hozzászóláshoz be kell jelentkezni
Van olyan hely ahol a legkisebb hibára is megy be helyette a cseredarab a polcról.
+1
Bónusz, hogy ilyenkor jellemzően még garanciás is :-)
- A hozzászóláshoz be kell jelentkezni
Morcos lennél, ha a folyószámlád egyenlegén lenne bit-flip (ofcoz a rossz irányba :)
- A hozzászóláshoz be kell jelentkezni
Van olyan hely, ahol 3 diszkes RAID1-et használok, pazarolva az anyagot. A közelmúltban ott is javítottam távolról pending sectort.
Bár valaki elmagyarázhatná, hogy pontosan mi ez a pending sector és miért tűnik el a teljes felület szektorfolytonos újraírásakor, mert csak amolyan képzeleteim vannak róla. De eddig mindig segített ez a távolról végrehajtható trükk.
Polcról bepattintani az ebben az esetben 6 órás autókázás egy frankó mikrohullámú toronyhoz. Egyébként szép helyen van.
- A hozzászóláshoz be kell jelentkezni
A (mai) diszkeken elég nagy hely van fenntartva a meghibásodott szekorok helyettesítésére.
Ha egy szektor hibásan olvasható, akkor a diszk operációs rendszere megjelöli, mint helyettesítendőt. (ez a pending)
Ha a helyettesítendő szektorra írás történik, akkor átkerül a láthatatlan hibás szektorok közé és a tartalékból kap egy helyettest. Az írás tartalma végül erre az új helyre kerül.
No, ez volt az első osztályos Móricka ismeretterjesztő magyarázat rózsaszín illatos levélpapíron. :-D Amit meg nem írtam ide, az több kötetre rúgna.
Az általad használt javítási módszer nem rossz, de nem is biztonságos. Megadok néhány szempontot, hogy kevesebbet kelljen autóznod. ;)
- A diszkhibák javítását lehetőleg offline (az operációs rendszer futását mellőzve) kell elvégezni - kivétel, ha tudod mit csinálsz.
- A javításhoz célszerű erre alkalmas szoftvert használni. (SpinRite, HDAT2, MHDD) Létezik rengeteg "low level formatter" (stb.), bár az írójának lila gőze sincs mi az, amit csinál. :(
- Ha a diszk vagy annak a hibás területe nincs használatban, és az operációs rendszer is megengedi, akkor lehet online is javítani.
- Egy hiba - több hiba önmagában nem probléma. A meghibásodás mértékének megítéléséhez figyelembe kell venni a hibák szaporodásának trendjét és az eszköz korát is. (Lásd mechanikai kopásgörbe: bejáratás, normál üzem, elhasználódás - élettartam vége)
Ezzel vége a következő rózsaszín fejezetnek! A valóságban egyéb esetek is előfordulnak.
- Az adatblokkok ellenőrzésére és javítására használt ECC biztosította lehetőségek korlátozottak és benne van a tévedés lehetősége is.
- A SMART csak egy tájékoztató rendszer, amiből lehet jósolni is, de sok esetben semmit nem fogunk megtud a diszkről. (Van erről pár tanulmány is.) Hiszen a SMART csak arról tud nyilatkozni, amiről tudomása van.
- Minden korábbi megállapítás csak az adatblokkokat érinti! *
* A mai diszkekben az ősrégi hard track és hard sector helyett minden soft - azaz a szervo információ még egy héjat képez az adatblokkok (szektor) körül. Ha az megsérül, akkor nem beszélhetünk adatblokkról, mert bár fizikailag létezik, de a rendszer képtelen megtalálni. (Ilyen esettel találkoztam, amikor egy windows pagefile.sys állományának elejében keletkezett egyetlen azonosíthatatlan szektor. Kivételesen az ok is kiderült: Nagy hidegben szállított gépet még hidegen bekapcsoltak, és ez látszott is a diszk naplójából.)
A másik SMART hatáskörén kívül álló hiba a szervó rendszer kisebb meghibásodása. (Sikerült vásárolnom egy olyan diszket, ami a korábbi modell és egy fejlett szervóval készült modell között készült. Az utolsó 12GB használaton kívülre került, mert ott olyan hangok keletkeztek, mint amikor megrázod a laza drótkerítést. ;))
Magánvélemények: Amit soha nem használok...
HDSentinel: A diszk 97%-os és néhány szektor hibával rendelkezik. Egyébként egyetlen bit adatot sem lehetett olvasni róla, de az első próbálkozástól mindig lefagyott.
Ubuntu: Sikerült a succccesfulll install, csak kernel nem volt a rendszeren. Kétszer is! :)
Viszont láttam már olyan operációs rendszert, amely önállóan kezelte a diszk hibákat: AIX - scsi, de akár idegen diszkekkel.
- A hozzászóláshoz be kell jelentkezni
A pending sector azt jelenti, hogy az oprendszer megpróbálta olvasni az adott szektort, de nem sikerült. A vinyó egy ideig próbálkozik, de végül olvasási hibát jelez vissza. Megjegyzi magának, hogy hibás a szektor, de még nem tudja átirányítani egy tartalék szektorra, mert nem tudja, milyen adat van benne, és ha átirányítaná, az adatvesztéshez vezetne. Két módon derülhet ki a szektor tartalma a vinyó számára: sok-sok próbálkozás után sikerül kiolvasni az adatot, vagy az oprendszer felülírja új adattal. A vinyó mindkét esetben megjelöli hibásnak a szektort, és átirányítja egy tartalékra (reallocated sector). Namost amikor te felülírod az egész vinyót, akkor a hibás szektort is felülírod, és a vinyó el tudja végezni az átirányítást.
- A hozzászóláshoz be kell jelentkezni
Tehát röviden: a HDD Sentinel általam használt funkciója gyakorlatilag ugyanezt a teljes felület újraírást csinálta, csak futó rendszer alól?
"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség
- A hozzászóláshoz be kell jelentkezni
Köszi a válaszokat (bucko-nak is). Már érdemes volt kérdeznem.
- A hozzászóláshoz be kell jelentkezni
Különbséget kellene tenni az OS általi hibás szektor megjelölés (pl. chkdsk-ben látszódó "bad block") és a HDD/SDD firmware általi szektor megjelölés (SMART attributum: reallocated / pending sector count) között.
- A hozzászóláshoz be kell jelentkezni
WD20EARS - 82684 óra van benne. Reallocated_Sector=9, Current_Pending=1457, Offline_Uncorrectable
az otthoni NAS egyik lába. Temetem már vagy 2 éve. Érdekes, hogy a Synology nem lökte még ki a tömbből.
- A hozzászóláshoz be kell jelentkezni
Ha RAID-ben van, akkor ahogy fentebb írtam, vedd ki a tömbből és add hozzá újra. A resync során a Pending sector felszámolódik ahogy szektorfolytonosan végigírod a diszk felületét.
- A hozzászóláshoz be kell jelentkezni
Ennek a módszernek azért van némi kockázata.
"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség
- A hozzászóláshoz be kell jelentkezni
Áh, ez már ilyen állapotban direkt a kuka fele fog kullogni. Az világos, hogy kevés rossz szektornál érdemes újrairatni, aztán kiderül még csinálja e vagy sem.
- A hozzászóláshoz be kell jelentkezni
ugy tudtam az uj mdadm eloszor block checksumot szamol, es ha nem egyezik akkor irja csak at az adatot.
A vegtelen ciklus is vegeter egyszer, csak kelloen eros hardver kell hozza!
- A hozzászóláshoz be kell jelentkezni
A sima check az így működik, feleslegesen nem írja újra.
Viszont ha kidobod a tömbből és újként berakod, akkor írni fogja.
- A hozzászóláshoz be kell jelentkezni