badblock

sérült merevlemezek

Hozzászólások

Adott egy 160 GB-s Samsung (IDE) winyó. Kb 2 éve használom nagy megelegédettséggel átlagos desktop-színvonalú terheltség mellett. Az egész lemez egy darab ext3 partíció, /dev/hdb1. A gépen ubuntu dapper fut, az fsck minden 30. mount során lefutott.

Tegnap az egyik fájl másolása közben input/output error volt, ezért umount-oltam a partíciót és ráeresztettem az fsck-t. A journalizing miatt hamar végzett clean eredménnyel, ezután ráeresztettem az fsck -f /dev/hdb1 parancsot. Ez egy kicsit tovább dolgozott, de megint mindent rendben talált. Ezután jött az e2fsck -c /dev/hdb1 hogy az esetleges badblock-okat megkeressem. Ez read-only teszt formájában kezdődik. A winyónak kb 5%-áig jutott el, amikor egy szektoron megállt, és nem tudott rajta továbbjutni. Kb 10 percen keresztül ismételgette annak a szektornak az olvasását. Mivel a teszt úgyis read-only volt, és nem akartam magamnak nagyobb bajt, ezért megszakítottam az e2fsck-t, és újraindítottam a gépet. Ekkor lefutott egy automatikus fsck, mivel úgy érezte, hogy már több ezer napja nem volt tessztelve a /dev/hdb1. Ezúttal talált badblock-okat és azt javasolta, hogy futtassam le kézzel az fsck-t. Így hát újra elindítottam az e2fsck -f /dev/hdb1 parancsot, ami meg is jelölt néhány badblockot, és törölt két fájlt. Ezután -c opcióval nem futtattam végig, mert bíztam benne, hogy a -f is megtalálta a badblockokat. Gondoltam akkor most minden rendben lesz, de nem. Egy másik fájl olvasása közben újra input/output error lett.

Kérdéseim:
1. Merjem ráereszteni újra az e2fsck -c /dev/hdb1 parancsot és hagyjam futni akkor is, ha órákat időzik egy szektoron?
2. Mi mást tehetnék még?
3. Mennyire bízhatok ezután a 2 évig nagy megelégedettséggel használt Samsung 160 GB-s winyómban?

-------------------------
Hiánypótló ismertető kezdőknek: A Linux filozófiája és az áttérés Windowsról

Sikerült lementeni az összes igazán értékes adatot a lemezről, most majdnem üres, így kicsit nézegetem... Elsőként kértem egy SMART infót, amely azt mutatja, hogy nulla a reallocated sector count (?). Kértem egy short tesztet is, az gond nélkül lefutott. Asszem most teleírom dd-vel a /dev/zero-ból, majd újraformázom és kerestetek vele badblock-okat.


sudo smartctl -a /dev/hdb
smartctl version 5.34 [i686-pc-linux-gnu] Copyright (C) 2002-5 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model:     SAMSUNG SP1614N
Serial Number:    S016J10XB28679
Firmware Version: TM100-24
User Capacity:    160.041.885.696 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 0
Local Time is:    Wed May  9 17:40:13 2007 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                 (5760) seconds.
Offline data collection
capabilities:                    (0x1b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        No Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        No General Purpose Logging support.
Short self-test routine
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        (  96) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   051    Pre-fail  Always       -       1
  3 Spin_Up_Time            0x0007   065   052   000    Pre-fail  Always       -       6016
  4 Start_Stop_Count        0x0032   098   098   000    Old_age   Always       -       2994
  5 Reallocated_Sector_Ct   0x0033   253   253   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   253   253   051    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0024   253   253   000    Old_age   Offline      -       0
  9 Power_On_Half_Minutes   0x0032   099   099   000    Old_age   Always       -       8645h+13m
 10 Spin_Retry_Count        0x0013   253   253   049    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       1469
194 Temperature_Celsius     0x0022   151   082   000    Old_age   Always       -       29
195 Hardware_ECC_Recovered  0x000a   100   100   000    Old_age   Always       -       131921402
196 Reallocated_Event_Count 0x0012   100   100   000    Old_age   Always       -       2
197 Current_Pending_Sector  0x0033   253   253   010    Pre-fail  Always       -       0
198 Offline_Uncorrectable   0x0031   100   100   010    Pre-fail  Offline      -       2
199 UDMA_CRC_Error_Count    0x000b   100   100   051    Pre-fail  Always       -       3
200 Multi_Zone_Error_Rate   0x000b   100   100   051    Pre-fail  Always       -       0
201 Soft_Read_Error_Rate    0x000b   100   100   051    Pre-fail  Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      8645         -

Device does not support Selective Self Tests/Logging

-------------------------
Hiánypótló ismertető kezdőknek: A Linux filozófiája és az áttérés Windowsról

hát időközben teleírtam dd-vel a /dev/zero-ból. aztán újra létrehoztam az ext3-at és ráeresztettem az e2fsck -c parancsot, hogy badblock-okat keressen. újra megakadt egy szektoron és a syslogban meg jöttek szépen az üzik, hogy nem tud mit kezdeni ezekkel a szektorokkal. most kiszedtem a gépből, és a gari papírokkal viszem a boltba. hosszú smart tesztelni akkor is lesz lehetőségem, ha nem cserélik, de a legtisztább az lenne, ha cserélnék.

-------------------------
Hiánypótló ismertető kezdőknek: A Linux filozófiája és az áttérés Windowsról

Nekem pont ilyen problemam volt, nem tudtam vele mit kezdeni ext filerendszer keretein belul. Raktam a helyebe reiserfs -t, azota problemamentesen dolgozik.
Meg kell jegyezni, hogy azon a gepen nincsenek kritikus fontossagu adatok (tehat pl. amit nem tudnek megint letolteni), ennek tudataban jo az elobbi megoldas nekem. Ugyanakkor miota igy allunk, meg semmi nem veszett el, pedig ez mar lassan egy eve van.

Lehetőség van még badblock futtatására, ez nem filerendszer szintű.
Esetleg még tudom javasolni a WD Data Lifeguard Diagnostic for DOS programját. Van CDről, floppyról bootolható verzió is. Kijelöli a bad sectorokat, így látszólag eltűnnek, de általában ha egyszer bad sectorok jelennek meg, akkor annak a hddnek harangoztak.
A MINDEN Samsungra 3 év gari van, vidd vissza és verd az asztalt még akkor is ha kis hazánk szutyok boltjai csak 1et adnak. Sajnos a Samsung nem fogad egyedi RMAt, csak a forgalmazón keresztül intézhető.

köszi a tippet a garanciával. megtaláltam a számlát és a garancia levelet is, amely teljes körű garanciát ír, és még 7 hónapig érvényes. most veszek egy rakat dvd-t és elkezdem leszedegetni a még megmenthető adatokat, aztán lepucolom és viszem is vissza a boltba. így lesz a legtisztább az ügy, remélem megszabadítanak tőle és adnak egy újat... :D

addig is fstab-ban átírtam, hogy csak ro mount legyen. (ezt csak azért írom ide, ha más is hasonló problémával küzd, akkor jusson eszébe...)

-------------------------
Hiánypótló ismertető kezdőknek: A Linux filozófiája és az áttérés Windowsról

Esetleg tanulságos lehet, hogy én hogy jártam.
Samsung 250es ide winyoról van szó, barátnőm gépében volt (van), és hogy attól-e, nem tudom, de egyszer bekapcsolás után nagyon gyorsan ki lett kapcsolva, talán föl se pörgött teljesen. Ezután jellegzetes bad sector tüneteket produkált, logban, meg még hangban is... Jóvan, mondom 3 év gar, visszaviszem aztán kész, de előtte megnéztem egykét dolgot, mert idegesített (1 hónapos winyó kb). Smart szerint semmi rendellenes, 0 reallocated, stb. Gyanús volt a dolog, de badblocks talált 20 körüli bad sectort.
Megnéztem a samsung gyari diagnosztika programjaval, es az is megerősítette, hogy a felület sérült, DE mielőtt visszaviszem csináljak low-level formatot, mert van hogy segít... Na mondom, nem hiszek benne, de megpróbáltam (ekkor már az adatok nem voltak rajta, mert részben lementettem, részben elvesztettem (fsck helyett mkfs-t írtam :D :D ))
Órákig futott, és kiírta, hogy kész.
Újraindítottam, rendszerlemezről badblocks nem talált hibát... Aztán szépen óvatosan használatba került újra a winyó, és röhej, de ez egy éve volt kb. és semmi baja...

Érdekes.

Amúgy most ott tartok a hdd-vel, hogy típusszám alapján megkerestem a Samsung honlapján a hozzá ajánlott diagnosztikai szoftvert (HUTIL), amivel leellenőriztettem részletesen. Kiírta, hogy a hdd hibás és próbáljam meg törölni, hátha az segít neki. Ezután elindítottam a Low-Level Format-nak nevezett opciót. Szépen lefutott (kb 5 óra alatt) és kiírta, hogy a lemez most már rendben van. Újra futtattam az ellenőrző programot, ami kiírta, hogy IRQ időtúllépés, aztán meg azt, hogy keressem fel a szervizt, mert nem tudja javítani a hibát. Reboot után újra megpróbáltam azért... Ugyanazt írta ki. Holnap vagy holnapután el is viszem a számlával, garilappal együtt vissza a boltba.

-------------------------
Hiánypótló ismertető kezdőknek: A Linux filozófiája és az áttérés Windowsról

ma visszavittem a boltba, nem kellett vernem az asztalt, korrektek voltak és bevették garanciára. kaptam egy cetlit, amivel majd át tudom venni a cserét. azt mondták, hogy a samsung szerviz nem kapkodja el a dolgokat, vannak olyan vinyók, amikre december óta várnak. ez legalább 4 hónap, ha jól számolom. viszont mondták, hogy ne aggódjak, ha egy hónap után nem jön meg, akkor adnak nekem újat a bolt készletéből. ha esetleg ez bekövetkezne, akkor természetesen beírom ide a bolt nevét.
-------------------------
Hiánypótló ismertető kezdőknek: A Linux filozófiája és az áttérés Windowsról

érdekes új fejlemény. ma felhívtak a boltból, hogy a samsung 2 hónapra vállalja a garanciás ügyintézést. ennyire viszont nincs pofájuk megvárakoztatni, szóval egy egyéni akciót adnak. beszámítják a 160-as wincsit mostani áron, és eladnak egy 250-es samsung wincsit a kettő közti különbözetért (1500 Ft). a paraméterek (cache, dB, stb) ugynazok, vagy jobbak, mint a 160-as volt, a 250-es vadiúj és 2 év garanciát adnak rá. furcsálltam, hogy miért nem 3 évet, de azt mondta a srác, hogy beszállítótól függ, hogy hány év garancia van rá.

ha ma senki nem ír olyat, hogy vigyázzak, mert átverés, akkor holnap elhozom. szerintem olyan jó ez az ajánlat, hogy már gyanús.
-------------------------
Hiánypótló ismertető kezdőknek: A Linux filozófiája és az áttérés Windowsról

A gyártók úgy adják a garanciát, hogy 3 év. Ez azt jelenti, hogy ők garantálják neked, hogy a termék 3 éven keresztül (naptári év) működni fog. Ha nem így történik, akkor ők adnak egy másik eszközt és azzal az idővel ami kiesett nálad megtoldják a garanciát. A Magyar törvény szerint neki törekedni kell a lehető leggyorsabban intézni a garanciális cserét, hogy ez az idő a lehető legrövidebb legyen. Na most bejön a szokásos "magyar trükközés" a garancia csúsztatás. Azaz valaki lead egy cuccot kap egy boltit helyette x idő után, de ugye 2 hónap múlva megjön a gyárból a javított/cserélt eszköz, amire úgye már csak a toldott gari van meg. Újként eladni nem lehet (jó esetben), de gariba neked simán odaadják :)

Ja és a gyár, ha már nem gyártják az adott típust, akkor az azt követőt adja ingyen. (pl. nekem a Maxtor/Seagate a 120asok helyett 160asokat küldött legutóbb.) De azért veled kifizetteték a különbséget.

Csak miheztartás végett.

Üdv,
nex