Sziasztok!
Van egy kevesebb, mint 2 éves Seagate vinyóm. Pár napja furcsa hangokat ad. Nem veri ki a fejet, annál csörömpölősebb. Mintha a csapágyat hallanám. Nem jön elő mindig. Viszont amikor előjön, mindig seek közben.
Feltünt, hogy rendkivül sokat reszeli a vinyót (seek), ugyanakkor a HDD led 10-ből 9X nem villog (nem kontaktos, ha konkrét lemezműveletet végzek, világit).
Logokban nincs hiba. Rendszer nem fagy, nem lassul, de baljós jelnek vélem.
smart adatok:
# smartctl -a /dev/sda
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda 7200.10 family
Device Model: ST3250820AS
Serial Number: 9QE2XT14
Firmware Version: 3.AAE
User Capacity: 250.059.350.016 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Fri May 22 17:41:30 2009 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 430) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 92) minutes.
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 112 091 006 Pre-fail Always - 49069838
3 Spin_Up_Time 0x0003 096 095 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 707
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 078 060 030 Pre-fail Always - 64769572
9 Power_On_Hours 0x0032 097 097 000 Old_age Always - 3184
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 719
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 060 056 045 Old_age Always - 40 (Lifetime Min/Max 23/40)
194 Temperature_Celsius 0x0022 040 044 000 Old_age Always - 40 (0 16 0 0)
195 Hardware_ECC_Recovered 0x001a 071 058 000 Old_age Always - 120512040
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
- 2163 megtekintés
Hozzászólások
1 Raw_Read_Error_Rate 0x000f 112 091 006 Pre-fail Always - 49069838
7 Seek_Error_Rate 0x000f 078 060 030 Pre-fail Always - 64769572
Erdemes lenne lassan cserelni :).
-------------------------------
“The 0 in Raid 0 stands for how many files you’re going to get back if something goes wrong” :)
- A hozzászóláshoz be kell jelentkezni
Hm, azok fel sem tüntek csak a kiemelt. Köszi, hogy felhívtad rá a figyelmem! Elég gáz, mert tényleg nem túl régi vinyó és csak hétvégente használtam.
Mostanában akartam +1 vinyót venni és RAID-1-be össerakni, HA később gond lenne. Ezekszerint hamarabb jön a baj, mint vártam.
- A hozzászóláshoz be kell jelentkezni
Érdekes dolog ez a smartctl, nekem zsír új, féléves, egy éves és régebbi vinyókra is dob "Pre-fail"-eket, márkától és kapacitástól függetlenül (80-500GB, Samsung/Maxtor (HP szerveres)/WD/Seagate)
- A hozzászóláshoz be kell jelentkezni
Biztató amit irsz:) Az előbb rendeltem egy Samsung Spinpoint F1 (HD322HJ) 320 GB-s vinyót. Berakom mellé raibe, aztán csak remélni tudom, hogy minél később fogva kivágni.
A hangjelenség mindenesetre nem túl biztato amit néha művel. Ill. a "folyamatos" seekeléstől is arra gondoltam, hogy vmit nagyon nem sikerül helyreraknia.
- A hozzászóláshoz be kell jelentkezni
Hi,
Nekem volt, hogy kábel okozott problémát, régi sata kábel ki (kicsit már lötyögött), új be, megszünt minden gond,
illetve az idők múlásával a táp nem adott ki magából annyit amennyit a HDD-k fel akartak venni. 3 volt, nyekegett minden, 1 et lehuztam siman ment minden, az kapott egy külső dobozt, kulso táppal.
hdparm -nál meg -F samsung vagy -F samsung2 :)
Üdv
Szijártó Zoltán
Aki tud az alkot, aki nem tud az csak szövegel.
- A hozzászóláshoz be kell jelentkezni
A tápellátás már engem is megviccelt, frankón összerakott szerver nem akart indulni. A hiba ott volt, h a cd-meghajtó tápkábele kiesett, és elcsúsztak egyet a meghajtók elnevezései :-) A táp gyengeségére én azért nem gyanakszom, mert 2-3 éves HP gép az összes amit néztem, nem gondolom hogy ennyi idő alatt kihalna. A kábel már inkább lehet, az egyik pont 1 méter hosszú, mert nem volt rövidebb a boltban ;-)
- A hozzászóláshoz be kell jelentkezni
Én annyira nem izgulok, mert ugyan a smartctl ezt írja, de _semmilyen_ hibát nem követtek eddig, az egyik 3 éve működő dob néha 1-1 errort a log-ba, de azon kívül semmi. Amikor először láttam az eredményeket én is meglepődtem, de valami más lehet a gebasz. Ha egyszer túlságosan ráérek majd, akkor az itthoni gépen végigjátszom a lehetőségeket, és ha megvan akkor megcsinálom a szerveren is (és persze blogolok róla itt).
- A hozzászóláshoz be kell jelentkezni
Samsung, Hiatachi és a WD vinyókat használok. Mindegyiknél van egy-két olyan cucc, ami eszeveszettül növekszik.
Szerintem amit igazán komolyan kell venni az a Reallocated Sector Count, a Reallocated Event Count (ha van ilyen az adott vinyónál) és az Offline Uncorrectable. Ha ezek bármelyike nem nulla, akkor azonnal cserélni. Ezen kívül smartd-t futtatni és napi statisztikákat küldetni. Akkor előkandikál. Persze a Google felmérése alapján ezek egyike sem véd meg valójában.
Egyébként meg gyanú esetén megnézheted a gyártóspecifikus utilityvel. Monfjuk Ultimate Boot CD-vel.
RAID-et pedig ettől függetlenül állítsd be. De a monitorozását is.
Üdv,
Dw.
"Jegyezze fel a vádhoz - utasította Metcalf őrnagy a tizedest, aki tudott gyorsírni. - Tiszteletlenül beszélt a feljebbvalójával, amikor nem pofázott közbe."
- A hozzászóláshoz be kell jelentkezni
En inkabb a raw mezot emelnem ki belole amugy. Ezeknek az adatoknak illik 0-nak lennie :).
-------------------------------
“The 0 in Raid 0 stands for how many files you’re going to get back if something goes wrong” :)
- A hozzászóláshoz be kell jelentkezni
Azert lehet, mert a pre-fail/old age nem az erteket jellemzi, hanem a valtozo jelleget. Azaz, egy tokeletes winchesternek is van pre-fail valtozoja.
- A hozzászóláshoz be kell jelentkezni
Aha. És ha az alábbi érdekes helyet áll elő? (Samsung SP0802N, 80GB, "-F samsung2" opcióval)
1 Raw_Read_Error_Rate 0x000f 100 100 051 Pre-fail Always - 0
....
195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age Always - 88448790
- A hozzászóláshoz be kell jelentkezni
samsung engem is szívat most. a hardware ecc recoveredre találtam kb. 4879 féle magyarázatot (pl. hogy az az ecc javított hibák számát jelenti, vagy hogy az a legutolsó ecc hiba óta eltelt idő, vagy hogy ez csak egy belső számláló, stb.). a lényeg: a h.ecc.corr.-ral nem kell foglalkozni samsungnál, mert baromságokat ír, és kikapcsoláskor nullázódik.
mans smartctl says:
"Attributes are one of two possible types: Pre-failure or Old age.
Pre-failure Attributes are ones which, if less than or equal to
their threshold values, indicate pending disk failure. Old age, or
usage Attributes, are ones which indicate end-of-product life from
old-age or normal aging and wearout, if the Attribute value is less
than or equal to the threshold. Please note: the fact that an
Attribute is of type 'Pre-fail' does not mean that your disk is
about to fail! It only has this meaning if the Attribute's current
Normalized value is less than or equal to the threshold value."
----------------------------------
feel the beat - it's everywhere!
- A hozzászóláshoz be kell jelentkezni
195 Hardware_ECC_Recovered 0x001a 071 058 000 Old_age Always - 120512040
Ez sem valami hűdeszép... Ленин сказал: "Учиться, учиться, учиться!", én meg hogy: backup, backup, backup...
- A hozzászóláshoz be kell jelentkezni
azzal semmi gond hogy nagy szám és pörög tovább minden lemezműveletnél.
Seagate smart jellegzetesség (minden winyójuk így jelzi)
az viszont, hogy a
1 Raw_Read_Error_Rate 0x000f 112 091 006 Pre-fail Always - 49069838
195 Hardware_ECC_Recovered 0x001a 071 058 000 Old_age Always - 120512040
ezek nem egyeznek, már nem jelent jót. Amíg ez a két raw érték ugyanaz, addig nincs semmi probléma.
Mivel itt teljesen más értékeket mutat, jó eséllyel kábelhiba van/volt.
Nálam több mint 32 ezer üzemóra után is pontosan egyezik a két érték egy 80GB-os 7200.7-en. Az 5 ezer órás új winyón is egyeznek az értékek.
Ha egyszer hiba történik, utána nem tudom, hogy újra összehangolódnak -e vagy pedig fix mértékű különbséggel mennek tovább.
egyébként
http://www.seagate.com/www/en-us/support/downloads/seatools
- A hozzászóláshoz be kell jelentkezni
Köszi a kiegészítést, mindig tanul az ember...
- A hozzászóláshoz be kell jelentkezni
nincs mit, engem is a szívbaj kerülgetett annó, mikor az első Seagate winyóm meglett :D A quantum nem így jelezte, hanem stabil 0án álltak ezek :)
- A hozzászóláshoz be kell jelentkezni
Végülis jogos: a nyers olvasási hiba az tetszik, vagy sem "van", viszont ha a hw-ECC korrigálja az első pillanattól kezdve, akkor a rendszer működik, ahogy kell.
- A hozzászóláshoz be kell jelentkezni
Seagate-en három érték van, amit figyelmen kívül kell hagyni. Ezek pont a Raw_Read_Error_Rate, a Seek_Error_Rate és a Hardware_ECC_Recovered. Pár generáció óta így van ez már (talán a B IV-estől felfele?).
- A hozzászóláshoz be kell jelentkezni
Köszönöm a válaszokat! Beszereztem egy 320-as samsung F1-et. Csendes, hüvös. Raid1-et csináltam belőlük. nagy baj majdcsak nem ér igy.
Azonban vettem egy Acer aspire one A150-et.
Barátnőmnek is ilyen van, ott több nap használat után is 0-t ir minden hibát jelölő sornál, nekem viszont:
http://pastebin.com/md41b142
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 100 253 006 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 100 253 030 Pre-fail Always - 606256
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 5
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 1
195 Hardware_ECC_Recovered 0x0012 066 064 000 Old_age Always - 12789588
1
A gép 5 órája megy, zsír új és minden smart lekérésnél növekednek ezek a számok.
Pontosan 6-tal növekszik a Seek_Error_Rate és 6-tal a Hardware_EC_Recovered.
120GB-s, nincs rajta semmi adat. Nem tudom érne-e valamit, ha megtömném random adattal, majd megpróbálnám visszaolvasni? Bár gyanítom, hogy ez inkább egy látens problémát jelez előre(?).
MOD: Letöltöttem a "SeaTools Enterprise"-t és lefuttam egy full tesztet: ./st -G /dev/sg0
Azt mondja PASSED.
Úgy tünik seagate-nél tényleg nem lehet a smart adatokra hagyatkozni. Közben olvastam több oldalon, hogy zsir új seagate vinyónál is szeretnek pörögni ezek a számok, holott semmi baja.
Remélem esetemben is ez lesz.
- A hozzászóláshoz be kell jelentkezni