Üdv!
Van egy Ubuntu szerver 8.10 telepítve szotveres RAID1,
két SCSI merevlemezen.
Egyedül FTP van, meg statisztikához egy webszerver megy a
egy belső hálón. Több mint egy hónapja megy gond
nélkül. Tegnap reggel read-only módba kapcsolta a
rendszer a gyökérkönyvtárat, mert hibát észlel.
Csak két partíciót készítettem anno, egy /boot és egy / (gyökér).
Utóbbi RAID tömbön LVM, ext3.
Most egyes fájlokat, ha megnyitok semmi nem látszik benne.
De talán lényegesebbek a következő kiementek:
vgscan -P
Partial mode. Incomplete volume groups will be activated read-only.
Reading all physical volumes. This may take a while...
/dev/md0: read failed after 0 of 4096 at 98500608: Input/output error
/dev/md0: read failed after 0 of 4096 at 98557952: Input/output error
/dev/md0: read failed after 0 of 4096 at 0: Input/output error
/dev/md0: read failed after 0 of 4096 at 4096: Input/output error
/dev/md0: read failed after 0 of 4096 at 0: Input/output error
/dev/block/80:0: read failed after 0 of 512 at 0: Input/output error
/dev/block/80:0: read failed after 0 of 512 at 18389139456: Input/output error
/dev/block/80:0: read failed after 0 of 512 at 18389254144:
... (Ismétlás más számokkal.
Input/output error
/dev/block/254:0: read failed after 0 of 4096 at 0: Input/output error
/dev/md1: read failed after 0 of 4096 at 18284609536: Input/output error
/dev/md1: read failed after 0 of 4096 at 18284666880: Input/output error
/dev/md1: read failed after 0 of 4096 at 0: Input/output error
/dev/md1: read failed after 0 of 4096 at 4096: Input/output error
/dev/md1: read failed after 0 of 4096 at 0: Input/output error
/dev/block/80:1: read failed after 0 of 512 at 98566144: Input/output error
/dev/block/80:1: read failed after 0 of 512 at 98660352: Input/output error
... (itt ez ismétlődik más számokkal)
/dev/block/80:18: read failed after 0 of 2048 at 0: Input/output error
-----------
tail /var/log/syslog
Mar 7 12:40:41 dhcp-10-1-80-124 kernel: [1964485.287669] lost page write due to I/O error on dm-1
Mar 7 12:40:41 dhcp-10-1-80-124 kernel: [1964485.287680] Buffer I/O error on device dm-1, logical block 431886
Mar 7 12:40:41 dhcp-10-1-80-124 kernel: [1964485.287699] lost page write due to I/O error on dm-1
Mar 7 12:40:41 dhcp-10-1-80-124 kernel: [1964485.543869] block-osm: TID 001 error status: 0x05, detailed status: 0x0a00
Mar 7 12:40:41 dhcp-10-1-80-124 kernel: [1964485.543901] end_request: I/O error, dev i2o/hda, sector 5788340
Mar 7 12:40:41 dhcp-10-1-80-124 kernel: [1964485.543948] Buffer I/O error on device dm-1, logical block 437253
Mar 7 12:40:41 dhcp-10-1-80-124 kernel: [1964485.543967] lost page write due to I/O error on dm-1
Mar 7 12:40:41 dhcp-10-1-80-124 kernel: [1964485.543992] JBD: Detected IO errors while flushing file data on dm-1
Mar 7 12:40:42 dhcp-10-1-80-124 kernel: [1964486.060151] block-osm: TID 001 error status: 0x05, detailed status: 0x0a00
Mar 7 12:40:42 dhcp-10-1-80-124 kernel: [1964486.060181] end_request: I/O error, dev i2o/hda, sector 18878028
------------
fdisk -l
Disk /dev/i2o/hda: 18.3 GB, 18389263872 bytes
255 heads, 63 sectors/track, 2235 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x000c229b
Device Boot Start End Blocks Id System
/dev/i2o/hda1 1 12 96358+ fd Linux raid autodetect
/dev/i2o/hda2 13 2235 17856247+ fd Linux raid autodetect
Disk /dev/i2o/hdb: 18.3 GB, 18389263872 bytes
255 heads, 63 sectors/track, 2235 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x000d5ee1
Device Boot Start End Blocks Id System
/dev/i2o/hdb1 1 12 96358+ fd Linux raid autodetect
/dev/i2o/hdb2 13 2235 17856247+ fd Linux raid autodetect
-----------
lvscan
pvscan
Ezekre nem ad semmit.
---------
reboot
-su: /sbin/reboot: Input/output error
----------
Most távolról érem el VPN-en keresztül, sajon újraindítás sem megy.
De gyanítom nem is segíteni.
---------
Hol kell kereseni a hibát? Haredver? Vagy logikai
összeomlás? Mere kellene indulni? Újratelepítés?
Termih
- 1942 megtekintés
Hozzászólások
cat /proc/mdstat mit mond?
mdadm hanyas verzió?
- A hozzászóláshoz be kell jelentkezni
Mar 7 12:40:41 dhcp-10-1-80-124 kernel: [1964485.543901] end_request: I/O error, dev i2o/hda, sector 5788340
smartctl-vel hosszú teszt, biztos megakad valahol (tehát hardver). Egyébként 18GB-os lemez már kb 7-8 éves megvan biztos, cserélni kéne.
- A hozzászóláshoz be kell jelentkezni
Köszönöm psc és elod válaszait!
Közben a mai napon muszáj volt benni a szerverhez. Valóban az egyik vinyo meghalt. Azt igérték lesz másik gép, le lesznek cserélve, most egy vinyoval megy még tovább.
> cat /proc/mdstat mit mond?
> mdadm hanyas verzió?
Ezt már nem volt alkalmam kiadni.
Mégegyszer köszönöm!
Termih
- A hozzászóláshoz be kell jelentkezni
Amennyiben hozzáférésed van a lemezhez érdekelne, hogy a smartctl mit mond rá.
SCSI lemezt eddig csak működőt vagy teljesen halottat láttam. Badsectorost még nem.
IDE lemezeknél ugye van smartmontools, scsi-ra van smart változókat kiíró program?
- A hozzászóláshoz be kell jelentkezni
Üdv Elod!
Megnézem, de éppen egyéb technikai okok miatt nem jutok be a hálózatba.
Termih
- A hozzászóláshoz be kell jelentkezni