[MEGOLDVA] Status: Predictive Failure

Hi,

Adott az alábbi tömb. Egy RHEL 4-es van rajta, ma az egyik partíciót ro-ba vágta. A hpacucli-t nézegetve előbb az egyik diszknél, restart után mindkettőnél a lentieket látom. Mindkét diszk forró (e.g nem tudom megfogni puszta kézzel), persze ez akár normális is lehet. 5 évet mentek eddig (a hely nincs hűtve, ahol vannak a szerver).
Nyilvánvalóan cserélnem kellene vagy akár kamu is lehet a jelzés?

Köszönöm!

-------

Array: A
Interface Type: SAS
Unused Space: 0 MB
Status: OK

Logical Drive: 1
Size: 136.7 GB
Fault Tolerance: RAID 1+0
Heads: 255
Sectors Per Track: 32
Cylinders: 35132
Stripe Size: 128 KB
Status: OK
Array Accelerator: Enabled
Unique Identifier: 600508B1001031373320202020200002
Disk Name: /dev/cciss/c0d0
Mount Points: / 2.9 GB, /opt2 48.8 GB, /var 4.9 GB, /usr 4.9 GB, /tmp 2
.0 GB, /opt1 69.3 GB
Logical Drive Label: A0168EB6QL77MU4173 FBFD

physicaldrive 1I:1:1
Port: 1I
Box: 1
Bay: 1
Status: Predictive Failure
Drive Type: Data Drive
Interface Type: SAS
Size: 146 GB
Rotational Speed: 10000
Firmware Revision: HPDA
Serial Number: 3NM3PQNR00009816QATQ
Model: HP DG146ABAB4
PHY Count: 1
PHY Transfer Rate: 3.0GBPS
physicaldrive 1I:1:2
Port: 1I
Box: 1
Bay: 2
Status: Predictive Failure
Drive Type: Data Drive
Interface Type: SAS
Size: 146 GB
Rotational Speed: 10000
Firmware Revision: HPDA
Serial Number: 3NM3Q83A00009816RDMH
Model: HP DG146ABAB4
PHY Count: 1
PHY Transfer Rate: 3.0GBPS

Hozzászólások

Nulladik lépésben backup. Meg az elsőben is.

Smartctl-lel érdemes lenne lecsekkolni, hogy mit mutat a SMART. Legalábbis ha az RHEL4-ben lévő verzió már be tud nézni a cciss vezérlő mögé...

"Jegyezze fel a vádhoz - utasította Metcalf őrnagy a tizedest, aki tudott gyorsírni. - Tiszteletlenül beszélt a feljebbvalójával, amikor nem pofázott közbe."

Okosság. Köszi.

-------
Device: HP DG146ABAB4 Version: HPDA
Serial number: 3NM3Q83A00009816RDMH
Device type: disk
Transport protocol: SAS
Local Time is: Thu Mar 8 08:56:58 2012 CET
Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: SERVO IMPENDING FAILURE SEEK ERROR RATE TOO HIGH [asc=5d, ascq=43]

Current Drive Temperature: 38 C
Drive Trip Temperature: 68 C
Elements in grown defect list: 90
Vendor (Seagate) cache information
Blocks sent to initiator = 2371913298
Blocks received from initiator = 318157939
Blocks read from cache and sent to initiator = 668872786
Number of read and write commands whose size <= segment size = 545154064
Number of read and write commands whose size > segment size = 0
Vendor (Seagate/Hitachi) factory information
number of hours powered up = 35202.65
number of minutes until next internal SMART test = 35

Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 0 0 0 0 0 0.000 0
write: 0 0 0 0 0 0.000 0

Non-medium error count: 0

SMART Self-test log
Num Test Status segment LifeTime LBA_first_err [SK ASC ASQ]
Description number (hours)
# 1 Background short Completed - 0 - [- - -]

Long (extended) Self Test duration: 2070 seconds [34.5 minutes]

"Mindkét diszk forró (e.g nem tudom megfogni puszta kézzel)"

Nem ezert mondjak hot-swapnak? :)

--
R2D2 a filmtörténet legmocskosabb szájú karaktere.
Minden szavát kisípolták.

Csere, mihamarabb. Kellemetlen, amikor a kettő egyszerre hullik ki.

Az egyik azóta failed lett. Üldözöm a nagykereket, de belátható időn belül senki nem tud szállítani.

Esetleg ha valakinek lenne két db, számlaképesen, akkor nagyon hálás lennék érte.

432320-001 HP 146GB 3G SAS 10K 2.5" SFF SP Hard Drive

Értelemszerűen nagyobb is jöhet, ha van valakinek.
Köszönöm!

Megoldódik lassan a probléma. Sikerült rendelnem kettőt. Remélem ideér mielőtt összedől a tömb.
Köszönöm mindenkinek a segítő szándékot!

Megjöttek a diszkek. Megvolt a csere meg a rebuild. Huh.
Köszi még 1x mindenkinek.