rossz szektortól csontrafagy? merevlez szívások, kérdések
Aktuális és visszatérő nagy problémám, hogy a bad-sector gyanús vinyókkal, amikkel a véletlen folytán összekerültem, csontrafagynak a gépek, amikben vannak - jobb esetben csak a programok, amiket a rossz szektor érint.
Mindkettő Samsung, az egyik egy HD321KJ, 3.5"-es "asztali" hdd - erről elég sok rosszat olvastam már egyébként -, a másik pedig egy 2.5-es laptop merevlemez, egy HM160HC.
Utóbbi egy aktív hűtés nélküli, "beágyazott" számítógépben van, és kb. 41 Celsius-fokon üzemel a smartctl szerint. Mielőtt egy igen alacsony terhelésű, de kritikus rendszer került volna rá, állítólag évekig rendben ment letöltőgépként. A rendszer rajta Centos 5.3, bár gondolom, hogy ez nem számít igazán. Na ez a gép csontrafagy, ha rossz szektorra fut úgy, hogy az vélhetően a /root partíción belül van. Korábban már szintén rossz szektoros volt, de áttettem a lemez egy másik részére a partíciót, ahol elvileg nem volt gond, és utána ment is rendesen kb. 2 hónapig, de mostmár nem. Itt nem lenne elvárhatóbb egy sima hiba, és egy megszakadt akármilyen művelet? Néha állítólag - amikor teljesen lefagy - kernel panic van. (A géphez csak távolról férek hozzá.)
Itt a smart log egy része, mindenki okulására:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 100 100 051 Pre-fail Always - 133
...
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 1910
195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age Always - 768
VISZONT:
198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0
...
Error 108 occurred at disk power-on lifetime: 5957 hours (248 days + 5 hours)
When the command that caused the error occurred, the device was in an unknown state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 01 6a 4e 09 e0 Error: UNC 1 sectors at LBA = 0x00094e6a = 609898
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 01 6a 4e 09 e0 00 02:16:15.312 READ DMA
ec 00 00 00 00 00 a0 00 02:16:14.187 IDENTIFY DEVICE
ef 03 45 00 00 00 a0 00 02:16:14.187 SET FEATURES [Set transfer mode]
ec 00 00 00 00 00 a0 00 02:16:14.125 IDENTIFY DEVICE
[Ilyenből elég sok van.]
Mivel a géppel korábban nem volt probléma, csak kb. 2-3 hónappal, miután feltettem rá a CentOS-t, egy kicsit úgy néz ki a megrendelő felé, mintha én lennék a hülye, hiába magyarázok bármit.
Mielőtt új vinyót vetetek velük, ami esetleg ugyanúgy nem fog működni, megkérdezem a tapasztaltabbaktól, hogy ugye még véletlenül sem fordulhat elő, hogy a linux esetleg valamit máshogy kezel, rosszul kezel, és azért jönnek elő mindenféle hibák? (>7 éve használok itthoni gépen kizárólag linuxot, és szerintem nem, de biztos, ami biztos. Amitől egyébként félek, hogy ezzel a samuval is hasonló történik, mint a két bekezdéssel későbbi példában: a megrendelő esetleg kipróbálja más gépben, windows alatt, és semmi baja nem lesz.)
Törvényszerű az, hogy csontrafagyjon egy program egy olyan fájl elérésekor, aminek egy része bad sectoros területen van? (LVM-en, ext3 fájlrendszeren) Ez a HD321KJ lemezzel fordult elő. A józan eszem és a korábbi tapasztalataim azt diktálják, hogy valamilyen hibát kellene, hogy kapjak előbb-utóbb, de nem... Mitől lehet ez?
Olyan már látott valaki, hogy egy rossz szektoros lemez meggyógyult? :S A HD321KJ merevlemezt épp akartam visszavinni gariba, hogy vegyek helyette valami jobb egeret, újrateszteltem 1 hónap pihentetés után, és sem a tesztelőprogramok, sem a "cat /dev/sda > /dev/null" nem jelzett hibát; látszólag meggyógyult a rohadék. Más gépben vizsgáltam, mint amiben eredetileg volt, de korábban ebben a másik gépben is hibákat jelzett. Eléggé fájt úgy új vinyót venni, hogy nem lehettett leszámítani a réginek az árát. Nem tudom, hogy nyomnám le a garis dolgot boltos torkán, ha aktuálisan nincs látható hibajelenség. Állítólag, ha valamit be-/megvizsgálnak, és jó(nak tűnik), a vevővel fizettetik meg a vizsgálat díját. Tud valaki erről konkrétat? Létezik ilyen jogszabály, rendelet, egyéb?
És végül: a HD321KJ helyett vettem egy 640GB-os Western Digital Caviar Blacket (WD6401AALS). Nagyon jó, villámgyors, ég és föld a különbség a HD321KJ-hoz képest - pl. szekvenciális olvasásban >2x, ami jobbára hibernálásból ébresztésnél jön csak jól, de ami a lényeg, hogy általános felhasználói élményben is óriási az előrelépés.
Kb. 2 hónap felhőtlenül boldog WD-használat után elkezdtem leveleket kapni a smart démontól, kb. minden gépindításkor: aszongya, CurrentPendingSector, és sokszor hallom a jól ismert, baljós hangot, hogy "tididididing, tididididing, tididididing", sokszor, egymás után, menet közben. Fagyás még nem volt, a hang viszont nagyon idegesítő. Ezzel kapcsolatban mit javasoltok? Vigyem vissza rögtön, vagy próbálkozzak meg a WD saját diagnosztikai programjával? Samu, Maxtor vinyókkal kapcsolatban olvastam, hogy a gyári programjaik tudnak olyat varázsolni, hogy a rossz vagy gyenge szektorokat a későbbiekben hagyja figyelmen kívül a merevlemez (vezérlőelektronikája?). WD-vel csinált már ilyet valaki? Akár korábbi példányokkal? Működött?
Röviden ennyi. K...a nincs szerencsém - annyi, de annyi idő elmegy ezekkel, és nincs előrébb az ember... Ilyenkor a szólásmondás jut eszembe: "Apám mindig mondta, menjek inkább péknek". Várom az építő jellegű hozzászólásokat, előre is köszi a segítséget mindenkinek. :)
- Tovább (rossz szektortól csontrafagy? merevlez szívások, kérdések)
- 1053 megtekintés