Merevlemezek, vezérlők

leszakadó merevlemez

Helló!

Vettünk pár hónapja egy külső uesbés, 1,5Terás vinyót. Mostanra beüzemeltem a házi szerverem, amire rákötöttem, hogy ott tároljam a zenéket, videókat, backupokat a különböző gépekről. Az elején fat32 fájlrendszer volt rajta. Jelentkeztek a lent részletezett problémák ezért átdobtam ext4-re, de a probléma megmaradt.

A probléma részletezése:
Van, hogy 1-2 nap, de van hogy pár óra után azt látom, hogy nem elérhető a felmountolt merevlemez.

dmesg üzenete utolsó pár sora, az első ide vonatkozó résztől általában ez:

[175144.120093] usb 1-2: reset high speed USB device using ehci_hcd and address 6
[175144.240128] usb 1-2: device descriptor read/64, error -32
[175144.470077] usb 1-2: device descriptor read/64, error -32
[175144.700083] usb 1-2: reset high speed USB device using ehci_hcd and address 6
[175144.820091] usb 1-2: device descriptor read/64, error -32
[175145.050066] usb 1-2: device descriptor read/64, error -32
[175145.280062] usb 1-2: reset high speed USB device using ehci_hcd and address 6
[175145.322373] usb 1-2: device descriptor read/8, error -71
[175145.462337] usb 1-2: device descriptor read/8, error -71
[175145.690086] usb 1-2: reset high speed USB device using ehci_hcd and address 6
[175145.732315] usb 1-2: device descriptor read/8, error -71
[175145.872277] usb 1-2: device descriptor read/8, error -71
[175145.980169] sd 2:0:0:0: Device offlined - not ready after error recovery
[175145.980210] sd 2:0:0:0: [sdb] Result: hostbyte=DID_ABORT driverbyte=DRIVER_OK,SUGGEST_OK
[175145.980225] end_request: I/O error, dev sdb, sector 2267334221
[175145.980306] sd 2:0:0:0: rejecting I/O to offline device
[175145.980349] sd 2:0:0:0: rejecting I/O to offline device
[175145.980394] sd 2:0:0:0: rejecting I/O to offline device
[175145.980429] sd 2:0:0:0: rejecting I/O to offline device
[175145.980539] sd 2:0:0:0: rejecting I/O to offline device
[175145.990145] sd 2:0:0:0: [sdb] Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK,SUGGEST_OK
[175145.990169] end_request: I/O error, dev sdb, sector 2267334461
[175145.997039] usb 1-2: USB disconnect, address 6
[175146.003895] Aborting journal on device sdb2:8.
[175146.004037] Buffer I/O error on device sdb2, logical block 149454848
[175146.004065] lost page write due to I/O error on sdb2
[175146.004132] JBD2: I/O error detected when updating journal superblock for sdb2:8.
[175146.380059] usb 1-2: new high speed USB device using ehci_hcd and address 8
[175146.500100] usb 1-2: device descriptor read/64, error -32
[175146.730076] usb 1-2: device descriptor read/64, error -32
[175146.960084] usb 1-2: new high speed USB device using ehci_hcd and address 9
[175147.080074] usb 1-2: device descriptor read/64, error -32
[175147.310078] usb 1-2: device descriptor read/64, error -32
[175147.540084] usb 1-2: new high speed USB device using ehci_hcd and address 10
[175147.582429] usb 1-2: device descriptor read/8, error -71
[175147.722273] usb 1-2: device descriptor read/8, error -71
[175147.950892] usb 1-2: new high speed USB device using ehci_hcd and address 11
[175147.992372] usb 1-2: device descriptor read/8, error -71
[175148.132329] usb 1-2: device descriptor read/8, error -71
[175148.240101] hub 1-0:1.0: unable to enumerate USB device on port 2
[175148.540082] usb 2-2: new full speed USB device using uhci_hcd and address 6
[175148.660069] usb 2-2: device descriptor read/64, error -32
[175148.890072] usb 2-2: device descriptor read/64, error -32
[175149.120086] usb 2-2: new full speed USB device using uhci_hcd and address 7
[175149.240087] usb 2-2: device descriptor read/64, error -32
[175149.470060] usb 2-2: device descriptor read/64, error -32
[175149.700082] usb 2-2: new full speed USB device using uhci_hcd and address 8
[175149.731849] usb 2-2: device descriptor read/8, error -71
[175149.871800] usb 2-2: device descriptor read/8, error -71
[175150.100251] usb 2-2: new full speed USB device using uhci_hcd and address 9
[175150.131762] usb 2-2: device descriptor read/8, error -71
[175150.271723] usb 2-2: device descriptor read/8, error -71
[175150.380071] hub 2-0:1.0: unable to enumerate USB device on port 2
[175997.739143] ext4_abort called.
[175997.739184] EXT4-fs error (device sdb2): ext4_journal_start_sb: Detected aborted journal
[175997.739226] Remounting filesystem read-only
[176262.132939] EXT4-fs error (device sdb2): ext4_find_entry: reading directory #2 offset 0
[181009.314882] EXT4-fs error (device sdb2): ext4_find_entry: reading directory #29400 offset 0
[175148.660069] usb 2-2: device descriptor read/64, error -32
[175148.890072] usb 2-2: device descriptor read/64, error -32
[175149.120086] usb 2-2: new full speed USB device using uhci_hcd and address 7
[175149.240087] usb 2-2: device descriptor read/64, error -32
[175149.470060] usb 2-2: device descriptor read/64, error -32
[175149.700082] usb 2-2: new full speed USB device using uhci_hcd and address 8
[175149.731849] usb 2-2: device descriptor read/8, error -71
[175149.871800] usb 2-2: device descriptor read/8, error -71
[175150.100251] usb 2-2: new full speed USB device using uhci_hcd and address 9
[175150.131762] usb 2-2: device descriptor read/8, error -71
[175150.271723] usb 2-2: device descriptor read/8, error -71
[175150.380071] hub 2-0:1.0: unable to enumerate USB device on port 2
[175997.739143] ext4_abort called.
[175997.739184] EXT4-fs error (device sdb2): ext4_journal_start_sb: Detected aborted journal
[175997.739226] Remounting filesystem read-only
[176262.132939] EXT4-fs error (device sdb2): ext4_find_entry: reading directory #2 offset 0
[181009.314882] EXT4-fs error (device sdb2): ext4_find_entry: reading directory #29400 offset 0

Mivel kéne próbálkoznom, hogy stabilabb legyen a cucc?

Köszönöm előre is a segítséget,
Kárpáti.

Törölt HDD tartalmának visszanyerése

Üdv,

Olyan embert keresek, aki - természetesen pénzért - vállalná törölt, formázott HDD helyreállítását (amennyire persze lehet). Ismerősöm ugyanis sikeresen rossz HDD-t formázott meg. GetDataBack és társai már megvolt, igazi sikert nem értünk el vele.

Akinek konkrét árajánlata van annak üzenetét várom pm-ben, aki esetleg tippet tud, hogy kit hol keressek erre annak pedig üzenetét a forumba.

ui.: kürtnél kevesebb összegre gondoltunk :)

1.8" ?

1.8"-as pata diszket (x41-be, konkretan) lehet szerezni valahol manapsag? Ujonnan, relative nagyot. Vagy csak 1.8"-as hordozhatokbol lehet(ne) kimu"teni?

Winyó kuka?

Sziasztok,

Tegnap vettem észre, hogy BSD-s gépem ilyeneket irogat dmesg-be:

ad5: TIMEOUT - READ_DMA48 retrying (1 retry left) LBA=759178399
ad5: TIMEOUT - READ_DMA48 retrying (0 retries left) LBA=759178399
ad5: FAILURE - READ_DMA48 timed out LBA=759178399
g_vfs_done():ad5s1d[READ(offset=377961889792, length=16384)]error = 5

Ez azt jelenti hogy a winyonak kuka?
Mert mukodik rendesen a gep amugy, adatok is megvannak.

Koszi

sdX-ből miért lesz hdX?

Sziasztok!

a biztonság kedvéért a rendszerről szoktam csinálni egy másolatot cp -ax segítségével.
most valami történt a gentoo-val szóval cp -ax vissza. azaz ugyan azt kéne vissza kapnom, amit anno elmentettem
na most a rendszer az sda és sdc-ből állo raid-en kéne legyen, de az mdadm.conf-ban UUID alapján vannak a dolgok, szóval bebootolt

de azt veszem észre, hogy a lemezek betűjelében végbe ment egy ilyen változás:
sda->hda
sdb->hdb
sdc->hdc
sde->sda
sdf->sdb
sdg->sdc
mi a fene ez?
mind sata, 2.6.25-ös kernel, de ezt nemsoká frissítem

3Ware 9650 RAID - DEVICE-ERROR

Egy érdekes hibával találkoztam. Többször használtam már 9000-es szériából 3ware RAID kártyákat. De olyannal, hogy mind két eszköz Device errort mondjon, még nem találkoztam.

Mellékelem nektek a "/c0 show" eredményét:


/c0 show

Unit  UnitType  Status         %RCmpl  %V/I/M  Stripe  Size(GB)  Cache  AVrfy
------------------------------------------------------------------------------
u0    RAID-1    OK             -       -       -       232.82    ON     OFF

Port   Status           Unit   Size        Blocks        Serial
---------------------------------------------------------------
p0     DEVICE-ERROR     u0     232.88 GB   488397168     S0URJ9CPB16043
p1     DEVICE-ERROR     u0     232.88 GB   488397168     S0URJ9CPB16044

A RAID státusza elvileg OK, de mi az oka annak, hogy mindkét porton lévő Samsung Winyónál DEVICE-ERROR üzenet olvasható? A rendszer egyébként teljesen hibátlanul atomstabilan működik, több mint fél éve.

Ez a DEVICE-ERROR csak valami flag? Eltűntethető valami újraszkenelés, újracsekk-el? Vagy mit is kell tennem ilyenkor?

Köszönöm segítségeteket!

-- Topi

Új winyó gond [megoldva]

Van egy 160 Gb samsung winchesterem, azon van egy ubuntu 8.04 és egy Debian 5.03

Ma meghozták az új winyómat, Maxtor 500 Gb, csatlakoztattam a géphez, ahogy illik.

Bootol(na) a debian, aztán megáll itt:
Booting, please wait...

Vagy itt:
[2.430038] hub 2-0:1.0: unable to enumerate USB device on port 1

Van valakinek valami ötlete?

Szerk:

KÉP

Szerk2:
Telepítettem arra egy ubuntut, de debian nem bootol továbbra sem, míg ubuntu elindul, és fel is ismeri a Maxtor winyót.

Ajjaj - halódó merevlemez?

Szervusztok!

Nemrég tértem vissza a bekapcsolva hagyott, de "zárolt képernyős" géphez, nem akart magához térni.
Ubuntu Jaunty fut rajta, az egérkurzor nyila látszott, de csak fekete háttéren... konzolon csak villogó kurzor.

Csak a Reset gomb segített, a bootolásnál az alaplap nem látta a merevlemezt. Teljes áramtalanítás, újra bootolás, elindult.
Ám a /var/log/kern.log ilyen csúnyákat mutat:

[ 702.008817] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[ 702.008824] ata1.00: BMDMA stat 0x5
[ 702.008831] ata1.00: cmd c8/00:90:99:67:f7/00:00:00:00:00/e1 tag 0 dma 73728 in
[ 702.008833] res 51/40:34:f6:67:f7/00:00:00:00:00/e1 Emask 0x9 (media error)
[ 702.008836] ata1.00: status: { DRDY ERR }
[ 702.008838] ata1.00: error: { UNC }
[ 704.064437] ata1.00: configured for UDMA/133
[ 704.064456] ata1: EH complete

Egy darabig ismételgeti, majd:

[ 716.458136] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[ 716.458142] ata1.00: BMDMA stat 0x5
[ 716.458150] ata1.00: cmd c8/00:90:99:67:f7/00:00:00:00:00/e1 tag 0 dma 73728 in
[ 716.458151] res 51/40:34:f6:67:f7/00:00:00:00:00/e1 Emask 0x9 (media error)
[ 716.458155] ata1.00: status: { DRDY ERR }
[ 716.458157] ata1.00: error: { UNC }
[ 718.216435] ata1.00: configured for UDMA/133
[ 718.216460] ata1: EH complete
[ 719.999477] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[ 719.999484] ata1.00: BMDMA stat 0x5
[ 719.999491] ata1.00: cmd c8/00:90:99:67:f7/00:00:00:00:00/e1 tag 0 dma 73728 in
[ 719.999493] res 51/40:34:f6:67:f7/00:00:00:00:00/e1 Emask 0x9 (media error)
[ 719.999496] ata1.00: status: { DRDY ERR }
[ 719.999499] ata1.00: error: { UNC }
[ 721.756435] ata1.00: configured for UDMA/133
[ 721.756471] sd 0:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE,SUGGEST_OK
[ 721.756477] sd 0:0:0:0: [sda] Sense Key : Medium Error [current] [descriptor]
[ 721.756484] Descriptor sense data with sense descriptors (in hex):
[ 721.756486] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
[ 721.756510] 01 f7 67 f6
[ 721.756518] sd 0:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
[ 721.756528] end_request: I/O error, dev sda, sector 32991222
[ 721.756558] ata1: EH complete
[ 721.758758] sd 0:0:0:0: [sda] 312581808 512-byte hardware sectors: (160 GB/149 GiB)
[ 721.767814] sd 0:0:0:0: [sda] Write Protect is off
[ 721.767818] sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00
[ 721.768195] sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
[ 721.770029] sd 0:0:0:0: [sda] 312581808 512-byte hardware sectors: (160 GB/149 GiB)
[ 721.770282] sd 0:0:0:0: [sda] Write Protect is off
[ 721.770286] sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00
[ 721.789047] sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA

Kicsit Google-oztam, és gyorsan telepítettem a smartmontools-t.
Futtattam egy gyors tesztet (smartctl -t short /dev/sda), majd
a smartctl --all /dev/sda a következőket mondja:

=== START OF INFORMATION SECTION ===
Model Family: SAMSUNG SpinPoint P80 SD series
Device Model: SAMSUNG HD160JJ
Serial Number: S08HJ1ML801431
Firmware Version: WU100-41
User Capacity: 160.041.885.696 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: ATA/ATAPI-7 T13 1532D revision 4a
Local Time is: Thu Oct 22 19:21:23 2009 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

>>> (nyissz, amúgy egy vicc, hogy általában rendben találja) <<<

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 100 077 051 Pre-fail Always - 19
3 Spin_Up_Time 0x0007 100 100 025 Pre-fail Always - 5824
4 Start_Stop_Count 0x0032 098 098 000 Old_age Always - 2944
5 Reallocated_Sector_Ct 0x0033 094 094 010 Pre-fail Always - 58
7 Seek_Error_Rate 0x000f 253 253 051 Pre-fail Always - 0
8 Seek_Time_Performance 0x0025 253 253 015 Pre-fail Offline - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 8725
10 Spin_Retry_Count 0x0033 253 253 051 Pre-fail Always - 0
11 Calibration_Retry_Count 0x0012 253 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 1601
187 Reported_Uncorrect 0x0032 001 001 000 Old_age Always - 8264719
190 Airflow_Temperature_Cel 0x0022 148 067 000 Old_age Always - 30
194 Temperature_Celsius 0x0022 148 067 000 Old_age Always - 30
195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age Always - 564207
196 Reallocated_Event_Count 0x0032 094 094 000 Old_age Always - 58
197 Current_Pending_Sector 0x0012 099 093 000 Old_age Always - 10
198 Offline_Uncorrectable 0x0030 253 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x000a 100 100 000 Old_age Always - 0
201 Soft_Read_Error_Rate 0x000a 253 001 000 Old_age Always - 11
202 TA_Increase_Count 0x0032 253 253 000 Old_age Always - 0

>>> (itt már van, ami aggaszt, de ez után még néhányszor:) <<<

Error 2125 occurred at disk power-on lifetime: 8724 hours (363 days + 12 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 20 89 66 f7 e1 Error: UNC 32 sectors at LBA = 0x01f76689 = 32990857

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 20 89 66 f7 e1 00 00:14:16.688 READ DMA
ec 00 00 00 00 00 a0 00 00:14:14.938 IDENTIFY DEVICE
ef 03 46 00 00 00 a0 00 00:14:14.938 SET FEATURES [Set transfer mode]
ec 00 00 00 00 00 a0 00 00:14:13.188 IDENTIFY DEVICE

Ezt megismétli párszor, Error 2125-től 2121-ig. A végén:

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed: read failure 90% 8724 32989590
# 2 Extended offline Completed: read failure 90% 8724 32989590

SMART Selective Self-Test Log Data Structure Revision Number (0) should be 1
SMART Selective self-test log data structure revision number 0
Warning: ATA Specification requires selective self-test log data structure revision number = 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Jól sejtem, hogy erről a lemezről le kell menteni mindent, majd a lemezt selejtezni kell?

Előre is köszönöm a segítséget!