Hibás szektor lezárása MEGOLDVA

Fedorát futtató asztali gép merevlemezén 3 szektor hibás. Lezárható-e linux alatt a 3 szektor? Szükséges-e utána a rendszert újratelepíteni, vagy a hibás szektorok kiiktatása a rendszer stabil futását nem befolyásolja?
Köszönöm a válaszokat:

Hozzászólások

Cseréld ki a merevlemezt, amíg nem késő. Szaporodni fognak a hibás szektorok, megbízhatatlan lesz, adatvesztés, és így tovább.
Liveról beboot-olva (ne legyen csatolva egy partíció sem a vinyóról):

badblocks -svn /dev/sda

--
robyboy

"Gondolkozni nehéz, ezért legtöbben ítélnek." - Márai Sándor

Amelyeket kiírsz dvd-re, de félévente újraírod, de egyébként veszel néhány 1-2 terás ssd-t és offline arra is elmented. Emellett vásárolsz egy szalagos tárolót és azon is megtartod. De mivel katasztrófa is lehet- úgy az egészről mentést tartasz vagy 3 különböző földrészen.

Kicsit túltoljátok, pedig zeller nem mondott hülyeséget.

Kell egy lokális, offline példányt tartani, amit időről-időre (adatok fontosságától függő gyakorisággal) szinkronizálsz. Ha megmurdel a gép, beszopod a cryptolockert, stb., ez elég jól fog jönni. Emellett kell az offsite mentés, amit consumer-ként megúszhatsz elég olcsón Backblaze-zel, itt viszont a határ a csillagos ég - nem elképzelhetetlen otthoni userként sem, hogy az egész csomagod feldobd Azure-ba egy GRS storage-be.

És legyen egy kipróbált visszaállítási terv. Az egész backupot a hajadra kenheted, ha a szükséges encryption key csak a lokális gépen, és a backup konténerben van meg.

Itt az idő cserélni. SSD-re, lehetőleg. Samu 850 evo, vagy 850 pro ajánlott.

Félig-meddig ontopic:

1. Ha van BAD sector a winchestereden, az előbb-utóbb szaporodni fog. Ha eddig még nem történt meg, akkor majd meg fog történni, ebben biztos lehetsz.

2. Az az adat, ami csak egy példányban létezik, az nem fontos adat.

3. A RAID nem backup: ha véletlenül törölsz egy RAID tömbről, akkor az letükrözi a törlés műveleteket is. Ha nincs backupod, akkor valószínűleg buktad az adatokat.

Igazából a kérdésemre nem kaptam pontos választ, úgy hogy újrafogalmazom. Kell-e, lehet-e a 3 hibás szektort (bár még nem tudom melyik az) úgy kiiktatnom, hogy a rendszer futását ne akadályozza? Az adatok könnyen menthetők. Vagy egyelőre nincs jelentősége a 3 hibás szektornak? (lsd: Zolti mai 11.17-es hozzászólását)

Steve

"A kor nem érdem, hanem állapot"

Jogos a kérdésed. Ha nincs fontos adatod azon a HDD-n, akkor két dolgot javaslok:
1. Vagy jelöld ki a fájlrendszerben a megfelelő fsck paranccsal. Ezt csak unmountolt fájlrendszer esetén teheted meg, például egy LIVE CD-ről futtatva. Ext4 esetén: http://www.commandlinefu.com/commands/view/8474/run-a-ext4-file-system-…
2. Átalakítod a partíciókat úgy, hogy a hibás szektorokra ne essen partíció

+1
Mélységesen igazad van.
Ennek ellenére a kérdés is egy kissé zavaros. :(
A "3 hibás szektor" információt vajon honnan szerezted meg? A rendszer blokk szinten kezeli a lemezt, ami általában 1kB méretnél kezdődik. Persze lehet akár 4k méretű is a szektor, mindezeket nem tudjuk.
Ha tényleg szektor a hiba, azt a kernel logból pontosan láthatod. Szóval érdemes lenne azt a fentebb ajánlott badblocks howto-t elolvasni!

A SMART képességgel bíró lemez képes javítani magát. Persze néha meg nem. ;) A hiba jellegéről szóló sejtést a "smartctl -Ax" parancs eredményének értelmezéséből nyerhetsz. Az említett okok miatt a badblocks egy magas szintű megoldás lehet - viszont mint ilyen - nem fogja javítani az alacsony szintű hibákat. Tehát ilyenkor papír és ceruza, mert esetleg legközelebbi formázáskor is ki kell hagyni a sérült részt! Ez ugye nem túl informatikai megoldásnak tűnik.

Ravasz, fogós kérdés, hogy ki lehet-e iktatni a hibás szektorokat a futó rendszer alatt. Ezek lehetnek egy nem vagy ritkán használt területen, de akár a swap közepében is... Nyilvánvalóan a hiba pontos behatárolása nélkül az újratelepítés sem old meg semmit.

A megoldás egy ökölszabály: hardver hibát soha nem javítunk online! (Persze létezik olyan rendszer ahol igen, de az nem a linux!)

Offline javitáshoz ajánlom a HDAT2 programot, amit floppyról stb. elindíthatsz. Érdemes egy nem használt részen tesztelni, hogy szereti-e a csatolót.

A szakértő "majd szaporodnak a hibák" hozzászólások igen sokat mondóak. :)) Ehhez nem árt ismerni a diszk életkorát sem. Ekkor a hibák szaporodásanak tendenciája alapján lehet jósolni. Az a 3 szektor akár az 1GB kapacitású lemezhez képest is nulla. (Bár az ilyen lemezet a HD Sentinel már csak 99%-ra értékeli. Nekem meg van egy 100%-os lemezem, ami el sem indul. :))))))))))))

Nem lévén szakember, sem gyakorlott felhasználó, nincsenek mélyreható ismereteim, így a kérdés újbóli megfogalmazása helyett belinkelem a lemezkezelő által készített SMART-diagnózist a lemez attributumairól. Ez gondolkodtatott el, és indított az egész probléma felvetésére.
Ime a képek:

http://kepfeltoltes.hu/view/150928/05_www.kepfeltoltes.hu_.png
http://kepfeltoltes.hu/view/150928/31_www.kepfeltoltes.hu_.png
http://kepfeltoltes.hu/view/150928/20_www.kepfeltoltes.hu_.png
http://kepfeltoltes.hu/view/150928/38_www.kepfeltoltes.hu_.png
http://kepfeltoltes.hu/view/150928/29_www.kepfeltoltes.hu_.png
http://kepfeltoltes.hu/view/150928/139458349129_www.kepfeltoltes.hu_.png

Talán így sikerül leszűkíteni a kört.
Steve

"A kor nem érdem, hanem állapot"

Halál amikor az amerikai szakkifejezéseket lefordítják magyarra.
Helyette szebb lett volna, ha a "smartctl -Ax" kimenetét bekeríted egérrel, majd ide rakod.
(Ezzel látnánk az error logot is, nem csak mesélnék róla!)

Tehát:
9 Bekapcsolva töltött idő -> Power On Hours =N/A ?????
Így megtudtuk, hogy a bekapcsolva töltött időt nem méterben, hanem órában NEM MÉRI ez a diszk. Roppant érdekes...

4 Felpörgések/leállások száma -> Start/Stop Count =9377
és a
12 Bekapcsolási ciklusok száma -> Power Cycle Count =6789
alapján igen öreg lehet a diszk!

193 Parkolózónába lépési ciklusok száma -> Load Cycle Count =255628
Ez végzetesen nagy érték. A diszk élettartamának egyik fontos mutatója. Célszerű lenne csökkenten a felesleges parkolások számát!

196 Áthelyezések száma -> Reallocation Event Count =2
Azaz 2 szektor hibás volt - átkerült a tartalék területre. Ezzel nincs semmi baj.

197 Függőben lévő szektorok száma -> Current Pending Sector Count =1
Erre a szektorra rá kellene írni valamit, hogy kihelyettesítse a diszk.

A javítás menete - mint írtam - két féle lehet.

Egyik féle:
1. Ha meg akarsz menteni valamilyen lényeges adatot (arról az 1 db függőben levő szektorról), akkor a kernel hibaüzenetei vagy a smart errorlog alapján be kell határolni a hibás szektor filesystem-ben elfoglalt helyzetét a badblocks segítségével.
2. A HDAT2 read/write/read/compare ("Most Powerful Test") módjával fel lehet frissíteni a diszket, miközben a hiba is kijavul. Van némi esély az adatvesztésre a függő szektoron.

A másik féle meg a mikor az 1. pont kimarad. ;)

Rossz esetben előkerülhet több hiba is. Ezért a lényeges adatokat érdemes menteni művelet előtt.
Ha ettől kell félni, érdemes először egy teljes olvasási tesztet végezni, hátha van még rossz szektor.

Nagyon rossz esetben nem javítható a hiba! (Ezt majd akkor!)

Ezek sajnos - a diszk méretétől függöen - több órás játékok lehetnek.

Mondtam, hogynem vagyok valami nagy informatikából. Használom, de nem mindent értek. Pl. ezt sem: "A HDAT2 read/write/read/compare ("Most Powerful Test") módjával fel lehet frissíteni a diszket,..." Mi az a HDAT2?
Aztán:"Helyette szebb lett volna, ha a "smartctl -Ax" kimenetét bekeríted egérrel, majd ide rakod." A smartctl -Ax egy konzolon kiadandó parancs?
És végül: "érdemes először egy teljes olvasási tesztet végezni, hátha van még rossz szektor". Oké, de hogyan kell egy teljes olvasási tesztet lefuttatni?
Üdv.

Steve

"A kor nem érdem, hanem állapot"

"Mondtam, hogynem vagyok valami nagy informatikából." :)

Ahol feljebb írtam a HDAT2 alá van húzva (vagy valami hasonló), azaz egy link: http://www.hdat2.com/
Ha egerentyűvel megnyomod, akkor a HDAT2 oldalára irányít. Ez egy DOS alatt futó program, amelyet valamilyen bootolható eszközre el kell juttatnod. (pl.: floppy :), pendrive, cd) A gépet erről kell bootolni, majd a programot elindítani. (Hasznos dolog, ha a DIR és CD parancsokat azért ismered.)
A Download menüben tölthetsz le ISO-t. Javaslom, hogy a 5. verzió helyett inkább a 4.93-at töltsd le!

Második megoldás, ha megkeresed az UBCD-t (google keresés -> első találat: Ultimate Boot CD), amely tartalmazza a HDAT2 programot. Csak a menüben kell megtalálni! ;) Viszon azt írja, hogy "HDAT2 5.0 - Latest stable release, but with device-level testing disabled." Ezt most éppen nem tudom mit jelent, de valószínűleg pont a javasolt teszteket nem lehet futtatni. :( Lehet kísérletezni korábbi verzióval...

"A smartctl -Ax egy konzolon kiadandó parancs?"
Bizony. De legalább nincs tele értelmezhetetlen magyar nyelvű hülyeségekkel. Nem, nem antinacionalista vagyok! ;) Viszont egy üzenetet bemásolva a google megmondja amit nem tudsz, míg a magyar félrefordítások alapján nem igazán.

Ha megnézted volna a HDAT2 programot, akkor beljebb lennénk. Van demo módja is, meg screenshot is!
Pl. a "Device Main menu"

Bal oldalon látszanak a "Device Tests Menu" elemei.
Pl.:
A "Check Bad Sectors only" semmit nem bánt, csak végigolvassa a lemezt.
A "Most Powerful Test": olvas, visszaírja, olvas, majd a két olvasás eredményét összehasonlítja. Ezzel a nem írható szektorokat is kiszűri, miközben "frissíti" a lemez adatterületét.
Kicsit lejjebb a SMART menüben nézheted meg az attribútumokat - amiket elküldtél. ("Read Attribute Data")

Sajnos ez egy hardver javítás! Nincs olyan lehetöség, hogy írd be ezt és nyomd meg azt és kész. Ha az autód nem húz 100km/h felett, akkor a szerelő nem fog az autópályán belebújni a motorházadba! Szépen felrakja egy fékpadra, rácsatlakoztatja a műszerei és méricskél. Semmi olyat nem mond, hogy nyisd fel a motorházat és balról a hetedik csavart húzd meg!

No, jöhetnek a további kérdések.

Hát akkor a további kérdések:
1. Miért nem bootol be a HDAT2iso_493.exe? Csak adatlemezként hajlandó kiíratni magát, ISO-ként nem. Így viszont a telepített rendszer indul el.
2. A Hiren Boot CD simán bebootol, feltálalja a kínálati listát, a DOS Programms-nál viszont megáll. Booting DOS Programs, - ezt még kiírja, aztán nem megy tovább, nem csinál semmit. Pedig elvileg itt kéne felkínálni olyat, hogy HDD Tools, és ezen belül a HDAT2-t, de idáig már nem jut el.Miért?
A smartctl -Ax kimenete: ERROR: smartctl requires a device name as the final command-line argument.Use smartctl -h to get a usage summary.
Ezt követően kilép.Miért?
Megjegyzés: a gép usb-ről nem bootol; csak linux van, még wine sincs, nem is kell.

Steve

"A kor nem érdem, hanem állapot"

1. A HDAT2iso_493.exe egy önkifejtő program (WinRAR self-extracting archive). Linux alatt pl a 7zip kicsomagolja belőle a hdat2_v493.iso-t amit ki kell írni.

2. Nem tudom. :(

Dejszen írja is: smartctl requires a device name as the final command-line argument - azaz az utolsó paraméter az eszköznév.
Ilyenkor illik beírni: man smartctl
Ez így kezdődik: smartctl [options] device

Tehát pl.: smartctl -Ax /dev/sda

ahol

-A, --attributes
[ATA] Prints only the vendor specific SMART Attributes. The Attributes are numbered from 1 to 253 and have specific names and ID numbers. For example Attribute 12 is "power cycle count": how many times has the disk been powered up.
(Megjegyzés: ATA==SATA - hosszú...)

-x, --xall
Prints all SMART and non-SMART information about the device. For ATA devices this is equivalent to
'-H -i -g all -c -A -f brief -l xerror,error -l xselftest,selftest -l selective -l directory -l scttemp -l scterc -l devstat -l sataphy'.

Kiegészítés: Így működik a 7zip

7z e hdat2iso_493.exe

7-Zip 9.20 Copyright (c) 1999-2010 Igor Pavlov 2010-11-18

Processing archive: hdat2iso_493.exe

Extracting hdat2_v493.iso

Everything is Ok

Size: 13504512
Compressed: 4485779

Talán a hupper plugin tréfált meg.

A hdrecover semmi érdekeset nem csinál, mindössze az akár kézzel is elvégezhető SMART kihelyettesítést erőszakolja ki. (Nézd meg a forrást!) Szóval csak ír, olvas, ellenőriz. A HDAT2 és társai (pl. SpinRite) a SMART kikapcsolása mellett dolgozik, így lehetőségük nyílik a SMART által nem/rosszul javított hibák saját algoritmussal történő kezelésére.

Ezért is javasoltam az oprendszer nélküli javítást, mert az a biztos. Jártam már úgy, hogy a programom nem csinált semmit, mert az ATA parancskészlet egyes elemeit a linux kernel kimaszkolja, azaz nem hajtja végre.
Alapos egyedi diszk piszkálásra meg az MHDD alkalmas - jól szkriptelhtő. Bár régen nem fejlesztik, de talán elég is amit tud. A kedvencem, amikor kiszínezve dumpolja a szektorokat - a szín pedig az egyes szektorok elérési idejét jelenti. Ilyen módon nem csak a hibás LBA-t kapod meg, hanem látszanak a "gyengébb" területek. Ilyennel pl. egy olyan diszket teszteltem, amiben a forradalmian új servo-t megvalósító firmware ELŐDJE volt, így az 500-ból az utolsó 12GB területen zörgött és lassú volt a diszk.

Naszóvalmégeccerfussunkneki: A hddrecover csak nagyon egyszerű javításra jó. A SMART meg a kommersz diszkek sajártja és szart sem ér, tehát nem bíznám rá a javítást. (Tán itt írtam: Van a HD Sentinel által kifogástalan diszkem - a SMART alapján - de sajnos egy bitet nem lehet leolvasni a diszkről.)

Azért nem ártana tudni, pontosan milyen merevlemezről van szó. Ha mondjuk WD Green, erősen el kezdenék aggódni, mentenék, amíg lehet, és sürgősen beszereznék valami mást, minimum egy bluet.

--------------------------

Csak a viták elkerülése végett. Ha nem használok ékezetet, mobiltelefonról írok.

Lefuttattam a HDAT2-t. Itt a kimeneti képernyő. 1 hibás szektort jelöl, lehet-e / kell-e vele valamit csinálni?


A képet a Képfeltöltés.hu tárolja. http://www.kepfeltoltes.hu

url=http://kepfeltoltes.hu/view/151003/HDAT2_www.kepfeltoltes.hu_.jpg][/url]
A képet a Képfeltöltés.hu tárolja. http://www.kepfeltoltes.hu

Steve

"A kor nem érdem, hanem állapot"

A hibás szektor LBA=70579650 - ezt ki kell javítani.

Device tests menu -> Detect and fix bad sectors menu ->
Setup -> First sector number = 70579523, Last sector number = 70579777 (kb. hiba +/- 127 szektor)
Device tests menu -> Detect and fix bad sectors menu (tehát vissza a setup-ból) -> Fix with READ/WRITE/READ

Remélhetően ez simán lefut. Utána
Device tests menu -> Powerful test READ/WRITE/READ/COMPARE
Kezdéskor a First/Last sector automatikusan visszaáll a diszk elejére és végére.
A diszk régi, lassú, de kicsi - remélhetően nem fog sokáig tartani a vizsgálat, amely gyakorlatilag frissíti az egész diszken az adatokat. Ha az ERRORS 0/0/0/0 marad a végén, akkor hibátlan a diszk, lehet írni olvasni.

A végén a SMART attribútumokat érdemes ellenőrizni, hogy mi változott!

Device tests menu -> Detect and fix bad sectors menu -> eddig oké, de ezeket a lehetőségeket nem találom: Setup -> First sector number = 70579523, Last sector number = 70579777 (kb. hiba +/- 127 szektor)
Device tests menu -> Detect and fix bad sectors menu (tehát vissza a setup-ból) Hogyan kell ide belépni és az adatokat beírni?
Ezek már simán megvannak:
Device tests menu -> Powerful test READ/WRITE/READ/COMPARE
Tehát a Setup stb kezdődő részt nem találom.

Steve

"A kor nem érdem, hanem állapot"

Bocs, elfelejtettem föltenni a smartctl -Ax kimenet eredményét. :(

"smartctl -Ax" kimenet eredménye:

[barist@Otthon ~]$ smartctl -Ax /dev/sda
smartctl 5.42 2011-10-20 r3458 [i686-linux-3.3.4-5.fc17.i686] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

Smartctl open device: /dev/sda failed: Permission denied
[barist@Otthon ~]$ su
Jelszó:
[root@Otthon barist]# smartctl -Ax /dev/sda
smartctl 5.42 2011-10-20 r3458 [i686-linux-3.3.4-5.fc17.i686] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family: Fujitsu MHS AT
Device Model: FUJITSU MHS2040AT D
Serial Number: NLA5T3515V4T
Firmware Version: 3005
User Capacity: 40.007.761.920 bytes [40,0 GB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: 6
ATA Standard is: ATA/ATAPI-6 T13 1410D revision 3a
Local Time is: Mon Oct 5 13:51:03 2015 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x80) Offline data collection activity
was never started.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 328) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
No General Purpose Logging support.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 55) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAGS VALUE WORST THRESH FAIL RAW_VALUE
1 Raw_Read_Error_Rate POSR-- 100 100 046 - 94620
2 Throughput_Performance P-S--- 100 100 030 - 270
3 Spin_Up_Time PO---- 097 097 025 - 24833
4 Start_Stop_Count -O--CK 084 084 000 - 9428
5 Reallocated_Sector_Ct PO--CK 099 099 024 - 3
7 Seek_Error_Rate POSR-- 100 089 047 - 854
8 Seek_Time_Performance P-S--- 100 100 019 - 0
9 Power_On_Seconds -O--CK 026 026 000 - 11171h+51m+45s
10 Spin_Retry_Count PO--C- 100 050 020 - 1
12 Power_Cycle_Count -O--CK 055 055 000 - 6831
192 Emerg_Retract_Cycle_Ct -O--CK 099 099 000 - 194
193 Load_Cycle_Count -O--CK 031 031 000 - 256072
194 Temperature_Celsius -O---K 100 020 000 - 27 (Min/Max 4/71)
195 Hardware_ECC_Recovered -O-RC- 100 100 000 - 78
196 Reallocated_Event_Count -O--CK 099 099 000 - 3
197 Current_Pending_Sector -O--C- 090 090 000 - 1
198 Offline_Scan_UNC_SectCt ----C- 099 099 000 - 2
199 UDMA_CRC_Error_Count -OSRCK 200 200 000 - 36
200 Write_Error_Count POSR-- 100 099 060 - 18377
203 Run_Out_Cancel -O---- 100 100 000 - 1529023824059
||||||_ K auto-keep
|||||__ C event count
||||___ R error rate
|||____ S speed/performance
||_____ O updated online
|______ P prefailure warning

ATA_READ_LOG_EXT (addr=0x00:0x00, page=0, n=1) failed: scsi error aborted command
Read GP Log Directory failed.

SMART Log Directory Version 1 [multi-sector log support]
SMART Log at address 0x00 has 1 sectors [Log Directory]
SMART Log at address 0x01 has 1 sectors [Summary SMART error log]
SMART Log at address 0x02 has 51 sectors [Comprehensive SMART error log]
SMART Log at address 0x06 has 1 sectors [SMART self-test log]
SMART Log at address 0x09 has 1 sectors [Selective self-test log]
SMART Log at address 0x80 has 16 sectors [Host vendor specific log]
SMART Log at address 0x81 has 16 sectors [Host vendor specific log]
SMART Log at address 0x82 has 16 sectors [Host vendor specific log]
SMART Log at address 0x83 has 16 sectors [Host vendor specific log]
SMART Log at address 0x84 has 16 sectors [Host vendor specific log]
SMART Log at address 0x85 has 16 sectors [Host vendor specific log]
SMART Log at address 0x86 has 16 sectors [Host vendor specific log]
SMART Log at address 0x87 has 16 sectors [Host vendor specific log]
SMART Log at address 0x88 has 16 sectors [Host vendor specific log]
SMART Log at address 0x89 has 16 sectors [Host vendor specific log]
SMART Log at address 0x8a has 16 sectors [Host vendor specific log]
SMART Log at address 0x8b has 16 sectors [Host vendor specific log]
SMART Log at address 0x8c has 16 sectors [Host vendor specific log]
SMART Log at address 0x8d has 16 sectors [Host vendor specific log]
SMART Log at address 0x8e has 16 sectors [Host vendor specific log]
SMART Log at address 0x8f has 16 sectors [Host vendor specific log]
SMART Log at address 0x90 has 16 sectors [Host vendor specific log]
SMART Log at address 0x91 has 16 sectors [Host vendor specific log]
SMART Log at address 0x92 has 16 sectors [Host vendor specific log]
SMART Log at address 0x93 has 16 sectors [Host vendor specific log]
SMART Log at address 0x94 has 16 sectors [Host vendor specific log]
SMART Log at address 0x95 has 16 sectors [Host vendor specific log]
SMART Log at address 0x96 has 16 sectors [Host vendor specific log]
SMART Log at address 0x97 has 16 sectors [Host vendor specific log]
SMART Log at address 0x98 has 16 sectors [Host vendor specific log]
SMART Log at address 0x99 has 16 sectors [Host vendor specific log]
SMART Log at address 0x9a has 16 sectors [Host vendor specific log]
SMART Log at address 0x9b has 16 sectors [Host vendor specific log]
SMART Log at address 0x9c has 16 sectors [Host vendor specific log]
SMART Log at address 0x9d has 16 sectors [Host vendor specific log]
SMART Log at address 0x9e has 16 sectors [Host vendor specific log]
SMART Log at address 0x9f has 16 sectors [Host vendor specific log]
SMART Log at address 0xa1 has 1 sectors [Device vendor specific log]
SMART Log at address 0xa2 has 1 sectors [Device vendor specific log]
SMART Log at address 0xa3 has 1 sectors [Device vendor specific log]

SMART Extended Comprehensive Error Log (GP Log 0x03) not supported
SMART Error Log Version: 1
ATA Error Count: 70 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 70 occurred at disk power-on lifetime: 11169 hours (465 days + 9 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 59 01 c2 f5 34 e4 Error: UNC at LBA = 0x0434f5c2 = 70579650

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c4 83 01 c2 f5 34 e4 00 11:50:56.375 READ MULTIPLE

Error 69 occurred at disk power-on lifetime: 11169 hours (465 days + 9 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 01 c2 f5 34 e4 Error: UNC 1 sectors at LBA = 0x0434f5c2 = 70579650

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 83 01 c2 f5 34 e4 00 11:50:51.389 READ DMA

Error 68 occurred at disk power-on lifetime: 11169 hours (465 days + 9 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 59 5f bf f5 34 e4 Error: UNC at LBA = 0x0434f5bf = 70579647

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c4 83 7f 9f f5 34 e4 00 11:50:45.104 READ MULTIPLE

Error 67 occurred at disk power-on lifetime: 9942 hours (414 days + 6 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 59 5f 76 45 45 e1 Error: UNC at LBA = 0x01454576 = 21316982

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c4 00 7f 56 45 45 e1 00 00:09:25.326 READ MULTIPLE

Error 66 occurred at disk power-on lifetime: 9938 hours (414 days + 2 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 01 80 45 45 e1 Error: UNC at LBA = 0x01454580 = 21316992

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
40 00 01 80 45 45 e1 00 00:13:49.818 READ VERIFY SECTOR(S)

SMART Extended Self-test Log (GP Log 0x07) not supported
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Conveyance offline Completed without error 00% 11147 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Warning: device does not support SCT Commands
SATA Phy Event Counters (GP Log 0x11) not supported
[root@Otthon]#

Steve

"A kor nem érdem, hanem állapot"

Ebből megtudtuk:

- Mégis van üzemideje a diszknek:
9 Power_On_Seconds -O--CK 026 026 000 - 11171h+51m+45s
Következésképp amelyik program ezt nem tudja kiolvasni, azt ne használd!

- A teljes diszk végigkefélésének időtartama jósolható ebből:
Extended self-test routine
recommended polling time: ( 55) minutes.
Ennek legfeljebb a két-háromszorosa lehet. (kb.!)

- Ezekről már volt szó:
5 Reallocated_Sector_Ct PO--CK 099 099 024 - 3
193 Load_Cycle_Count -O--CK 031 031 000 - 256072
196 Reallocated_Event_Count -O--CK 099 099 000 - 3
197 Current_Pending_Sector -O--C- 090 090 000 - 1

- Az error logból látszik, hogy három helyen és három eltérő időpontban történtek a hibák.
A tendencia - véleményem szerint - nem túl súlyos. A diszk közeledhet az elhasználódás felé, de ez nem biztos. Ez hályogkovácsászatnak tűnhet, de ha utána olvasol, akkor megérted.

- A hibák egyik lehetséges oka:
194 Temperature_Celsius -O---K 100 020 000 - 27 (Min/Max 4/71)

A diszk specifikációjából

Temperature - Operating
5°C to 55°C (ambient)
5°C to 60°C (disk enclosure surface)

Thermal gradient
20°C/h or less

Ezt bizony alul/felül túllépte a diszk!
Nem ártana kipucolni a hűtő rendszert!
Az utolsó adat szerint, ha pl. -20 fokban sétálgatsz a géppel, akkor legalább 3 órát kell melegíteni, hogy a 25 fokos szobában bekapcsolhasd! És nem szabad a kályhára rakni!

Lefuttattam a HDAT2-t, úgy ahogy írtad. Csont nélkül lement, nem írt ki a végén egyetlen hibát sem. Ezek szerint sikerült a javítás. Köszönök minden segítséget, nélküled nem tudtam volna megoldani. Szóval: Mégegyszer kösz.
A házilagos tisztítás szerinted megoldható?

Üdv.:

Steve

"A kor nem érdem, hanem állapot"

Azért a SMART-ot nézd meg, hogy mi változott!

Tisztítás.

Először meg kellene győződni az egyes alkatrészek hőmérsékletéről. (linux alatt: lm-sensors)
Nem biztos, hogy annyira súlyos a helyzet. Mindenesetre érdemes elgondolkodni, mikor volt 4 fokos a gép és mitől lehetett 71 fokos! Télen szellőztetéskor, napon vagy ágyban párnák közt? ;)

Ha ez laptop, akkor add meg a típusát! Van olyan, ami alulról bontható 3 csavarral, meg olyan is, ami 50 csavarral és 20 pucukával.

Ha desktop, akkor mindenképpen tisztítható.

Kell hozzá:
- porszívó (a profik olajmentes kompresszorral/drága sürített levegővel fújják!)
- porecset (a festékboltban a legolcsóbb)
- csavarhúzó (Philips 1, 2)
- hővezető paszta (ha a CPU-t, laptopban a grafikus csipet kell újra kenni)
- esetleg alkohol (a rászáradt hővezető paszta eltávolításához)

Szóval némi info után folyt. köv.

A HDAT2-n a SMART attributumoknál nagyon sok hibát ír (Error). Már maga a cd is azt jelzi a menüben, hogy a Smart hibás (Error) A menü elemei nem is futottak végig. Sajnos nem tudok angolul, így nem értem, képet pedig nem tudok most mellékelni. A fc lemezkezelőjének SMART ellenőrzése az alábbi eredményt hozta.


A képet a Képfeltöltés.hu tárolja. http://www.kepfeltoltes.hu

url=http://kepfeltoltes.hu/view/151009/49_www.kepfeltoltes.hu_.png][/url]
A képet a Képfeltöltés.hu tárolja. http://www.kepfeltoltes.hu

url=http://kepfeltoltes.hu/view/151009/49_www.kepfeltoltes.hu_.png][/url]
A képet a Képfeltöltés.hu tárolja. http://www.kepfeltoltes.hu

url=http://kepfeltoltes.hu/view/151009/49_www.kepfeltoltes.hu_.png][/url]
A képet a Képfeltöltés.hu tárolja. http://www.kepfeltoltes.hu

Az asztali gép egy itteni számítástechnikai cég által 7-8 éve összeállított konstrukció ASUS házban, tehát tkp "no Name".
Viszont van két laptopom, amire ráférne a kipucolás. Az egyik régi, kb éves ACER TM290, a másik HP Pavilion G15, kb 2,5 éves.Ha erre tudsz tippet adni, megköszönöm.

Steve

"A kor nem érdem, hanem állapot"

Mintha nem történt volna semmi! A SMART 5, 196, 197, 198 értékek változatlanok!
Lehetséges esetek:
- Nem futtattad a második és harmadik tesztet. Pedig pontosan leírtam - közben lépegettem az demo programban!
- Nem javitható a hiba. Bár ennek kisebb a valószínűsége.

Error, error - az csak egy szó. ;)
Ha ezt megnézed: S.M.A.R.T. - Wikipedia, the free encyclopedia, a táblázatban kiszínezték a kritikus hibákat. Még angol tudás sem kell. A kiértékeléshez viszont nem elég az angol, hanem némi rutin és helyes értelmezés is szükséges.

A HDAT2 nyitóoldalán csak annyit jelez, hogy a kritikus jellemzők között van >0 érték. De pl. a security állapot frozen értékére is jelez. (= A biztonsági beállításokkal kapcsolatos parancsok tiltva a következő indításig.)

A HP Pavilion G15 szétszerelésének nehézségi foka 10/10, az ACER TM290 esetén 6/10. Van olyan, amikor 3-4 csavar eltávolítása után lehet kiemelni a hűtőrendszert. Ezt értéklem 0,5/10-re. Szóval gyakorlat híján szerviz! Budapest VII. kerületben tudok nagyon olcsó helyet. Sajnos ez a legjobb ajánlatom. :(

Források:
http://tim.id.au/laptops/acer/travelmate%20290.pdf
https://www.youtube.com/watch?v=EuovxquGRFk

Újra lefuttattam az egész HDAT2-t. Egyetlen probléma akadt, ami úgy látszik, a múltkor elkerülte a figyelmemet. Idézlek:"Device tests menu -> Detect and fix bad sectors menu (tehát vissza a setup-ból) -> Fix with READ/WRITE/READ.Remélhetően ez simán lefut."
Nem futott le. Elindult, de azonnal a végére ment End of test felirattal. Error/sector/ 0/0/0/0. Az előző 3 testet megcsináltam, nem hozott ki hibaeredményt. Most kiváncsi leszek, a SMART attributumokban lesz-e változás.

Steve

"A kor nem érdem, hanem állapot"

Nagyon kavarsz! :)

Összesen 3 dolgot kell csinálni.

1) Olvasási teszt - ez megvot. Sikerült is megtalálni a hibás szektort.

2) A hibás szektor előtt kezdve és utána befejezve javítás.

3) Ha a 2. pont rendben lement, akkor egy teljes frissítés - újraírással.

Szóval most hol tartunk?

Megpróbálom világosabban megfogalmazni a helyzetet.A Device test menü ennél a pontnál akadt el: Fix with READ/WRITE/READ. Elindul a művelet (kék sáv), majd kb 2-3 sec után a végére ugrik és megjelenik a felirat: End of test. Tehát nem megy végig. Erre írtad te korábban, hogy remélhetőleg rendben lefut. Odáig minden test rendben lement, sőt utána a Power full test READ/WRITE/READ/COMPARE is rendesen lemegy. De a Fix with READ/... stb-t úgy tűnik átlépi. Tehát akkor lehet, hogy mégsem javítható a lemez?

Steve

"A kor nem érdem, hanem állapot"

Ezt írtam:
... Setup -> First sector number = 70579523, Last sector number = 70579777 (kb. hiba +/- 127 szektor) ...
Ha ezt beállítottad, akkor tizedmásodperc alatt is lefuthat. A kék csík alatt ír hibát, ha volt.

Ugyanígy a Power full test READ/WRITE/READ/COMPARE után a következő számok a felsorolt műveletekben talált hibákat mutatják, illetve a csík alatt a hibákat részletezve.
A Current pending sector akkor fordul elő, ha nem történt írás a bizonytalanul/rosszul olvasott szektorra. A diszk nem "jogosult" csak úgy mindenfélét írkálni, ezért kell beavatkozni. Tehát:
- a sérült szektort lehetőleg le kell olvasni
- visszaírni
- ha a visszaírás sikertelen, akkor a diszk automatikusan kihelyettesíti
-- ekkor csökken a pending és nő a reallocated szektorok száma.
Ezt teszi a READ/WRITE/READ/COMPARE.

Rossz esetben nem működik a dolog.
Az attribútumok olvasásával lehet ellenőrizni mi történt! (Ezt én innen nem tudom megmondani.)

Mi ez a sok bohóckodás? Elmagyarázom:
A SMART részben parasztvakítás, illetve a diszket kezelni nem tudó rendszerek számára készült consumer diszkek sajátja. Sem a Windows, sem a linux nem kezeli rendesen a diszkeket, de ezeket nem is tudná. Ezért kell kézimunkázni. Ezzel szemben mondjuk AIX alatt egy IBM által nem támogatott SCSI diszk hiba a hibanaplóban így néz ki:
- írási hiba történt
- parancsot adtam a hibás szektor hardveres (a diszk maga) kihelyettesítésre
- a hardver kihelyettesítés sikertelen volt
- szoftveresen (az operációs rendszer) kihelyettesítettem a hibás szektort
Tehát észre sem veszed, csak a naplóban látod.

Egy meghibásodás az esetek jó részében nem mutat meg semmit. Maga a meghibásodás és élettartam is valószínűségi és statisztikai adat. Az abszolút hibátlan diszk is kinyiffanhat, de a sok hibával rendelkező is működhet még sokáig. Ezért érdemes a diszk életkora és a meghibásodások szaporodásának a trendje alapján jósolni. Természetesen a valószínűségi jelleg miatt ez pont így igaz!

Visszatérve a nemstatisztikai ;) 1db diszkedre, minden lehetséges. Attól függ, hogy mi a hiba.
De ha a Powerfull test 0/0/0/0 eredménnyel zárul, akár hibás lehet a SMART bejegyzés. Sajnos ilyet is láttam már.

A Powerfull test 0/0/0/0/ eredménnyel zárult. Ezért zavart meg, hogy a SMART mégis hibát jelez.
Köszönöm a rengeteg segítséget, amit Tőled kaptam. Azt hiszem, elmentünk odáig, amíg lehet. A következő lépés a HDD cseréje lesz.

Üdv.

Steve

"A kor nem érdem, hanem állapot"

:)
A hdd regenerátor oprendszer felett fut. Ezért nem éri el a diszk interfészét közvetlenül, azaz csak a kernel által megengedett parancsok mennek a diszk felé. (Ez linuxon is így van.)
Persze még windows alatt is futtattam pl. pottalk segítségével olyan dos programot, ami az io privilégiumot megszerezve közvetlenül kezelte a diszket. Bár ehhez célszerű az oprendszerből leválasztani a kezelt diszket. Meg egy kicsivel többet kellett volna magyarázni...

Ha tudod mit csinálsz, akkor a fontos adatok kivételével felesleges a mentés. A végtelen türelem meg néha megéri. Pl. a barátom hdsentinel által tök hibásnak jelzett diszkje is abszolút hibátlan volt. Ezután már lila fejjel kérdezte, hogy a szervizben huszasért cserélt diszk is hibántlan lehetett-e. Minden bizonnyal, csak a szervizes sem volt türelmes. ;)

A türelem meg nem elég. Olvastam már néhány diszknek a teljes műszaki leírását, no meg az ATA szabvány néhány verzióját is, sőt programoztam is ezek alapján - hem is sokat. Ezért néha azt hiszem, hogy tudom miről beszélek. ;)