sarge - sata sw raid - I/O error :((

Fórumok

sarge - sata sw raid - I/O error :((

Hozzászólások

Elöljáróban a hibaüzenet :
[code:1:3311352729]
md : errors occured during superblock update, repeating
ATA : abnormal status 0x80 on port 0xE407
ATA : abnormal status 0x80 on port 0xE407
ATA : abnormal status 0x80 on port 0xE407
ata1: command 0x35 timeout, stat 0x80 host_stat 0x21
ata1: status=0x80 {Busy}
scsi0: ERROR on channel 0, id 0, lun 0, CDB : write (10) 00 09 41 ....
Current sda : sense key volume Overflow
ASC=22 ASCQ=c0
end_request: I/O error, dev sda, sector 155268031
[/code:1:3311352729]

Aztán ugyanezt ismétli jópárszor és vége a köv. kernel panic lesz :
[code:1:3311352729](0)Kernel panic - not syncing fatal encryption in interrupt.[/code:1:3311352729]

Ezután rendszer "meghal" mintha egesz sata busz beadta volna unalmas , restart után

[code:1:3311352729]
Mar 20 10:26:44 solum01 kernel: md: kicking non-fresh sda1 from array!
Mar 20 10:26:44 solum01 kernel: md: unbind<sda1>
Mar 20 10:26:44 solum01 kernel: md: export_rdev(sda1)
Mar 20 10:26:44 solum01 kernel: md: md0: raid array is not clean -- starting background reconstruction
[/code:1:3311352729]

--add al simán ujra szinkronizálhato sda1...

A legjobb hogy eza jelenség minden hajnalban jelentkezik UGYANAKKOR ! napközben hibamentes minden, éjszakai mentés is lemegy hibanélkül, masik nagyon fura hogy rendszer nemrégóta muxik és eleinte (pár hétig) semmi gond nem volt vele, csak azután ütött be a krah.

HDD-k SATA-k. kernel 2.6.11, sata vezérlő 1 LSI INtel lapon

Ami nem világos :

1. mirror másik fele miért nem viszi tovább a rendszert ? lehet hogy vezérlő "nyúl mellé" ? vagy lehet hogy aza gond hogy swap ugy van megcsinálva hogy mirror mindkét felén van 1-1 kisebb swap és mindkettő hozzá van csatolva swap-ként ?

2. egyáltalán mitől lehet ez ? megoldás ?
- vlmi acpi funkció bugzik be éjjel lakapcsolja és nem tudja reggel elinditani ?
- ha HDD hiba (eddig mindig ugyanarra sda-ra irta) akkor miért mindig ugyanakkor jön elő ? és miért nem jelzi a bekapcsolt SMART ? meg a BIOS es miert lehet hibanelkul ujra szinkronizalni ?
- attók hogy egyik hdd-re I/O error van miert hal meg utána egész SATA busz ? (mar ha erről van szó...)
[/code]

Nem vagyok tul jaratos a Sata es a Raid taruleten, de ha minden hajnalban ugyanakkor jelentkezik a hiba, akkor ajanlanam, hogy nezd at a feladatutemezot(valoszinuleg cron). Esetleg az futtat valamit, ami eloidezi az adott problemat. Altalaban reggel 6 ora korulre szoktak utemezni a kolonbozo disztribuciok a napi feladatok vegrehajtasat. Tobbnyire kulon log fajlba logolnak.
Mas otletem nincs. Sok sikert a hiba vadaszathoz.

[quote:6f874aeab9="vajtsz"]

HDD-k SATA-k. kernel 2.6.11, sata vezérlő 1 LSI INtel lapon

Ami nem világos :

2. egyáltalán mitől lehet ez ? megoldás ?
- vlmi acpi funkció bugzik be éjjel lakapcsolja és nem tudja reggel elinditani ?
- ha HDD hiba (eddig mindig ugyanarra sda-ra irta) akkor miért mindig ugyanakkor jön elő ? és miért nem jelzi a bekapcsolt SMART ? meg a BIOS es miert lehet hibanelkul ujra szinkronizalni ?
- attók hogy egyik hdd-re I/O error van miert hal meg utána egész SATA busz ? (mar ha erről van szó...)

Hello,

A S.M.A.R.T. SATA HDD-kre még nincs elkészítve, de már dolgoznak rajta. Ezt távolítsd el, lehet hogy ott lesz a baj.

[quote:e0912a988d="nigiboy"]Nem vagyok tul jaratos a Sata es a Raid taruleten, de ha minden hajnalban ugyanakkor jelentkezik a hiba, akkor ajanlanam, hogy nezd at a feladatutemezot(valoszinuleg cron). Esetleg az futtat valamit, ami eloidezi az adott problemat. Altalaban reggel 6 ora korulre szoktak utemezni a kolonbozo disztribuciok a napi feladatok vegrehajtasat. Tobbnyire kulon log fajlba logolnak.
Mas otletem nincs. Sok sikert a hiba vadaszathoz.

Az 5let nemrossz, megnéztem amit én raktam bele napi crontab bejegyzéseket és nem nagyon fontosab kivettem jól (de egyik sem ilyen hajnali 2-5 körülre volt időzítve.
Megnézem /etc/crontab.daily ami crontabból 6 kor fut, de egyrészt nem ilyenkor jön elő a hiba hanem joval korábban 3-4 óra körül van utolsó syslog bejegyzés (és semmi error term.) meg ezek a daily scriptekkel nemnagyon tok mit kezdeni, meg sztem ilyen HDD I/O errort azok nem csinálhatnak. Vagy mégis ? mit keressek ???

[quote:4fe95fe35c="FeriX"][quote:4fe95fe35c="vajtsz"]

HDD-k SATA-k. kernel 2.6.11, sata vezérlő 1 LSI INtel lapon

Ami nem világos :

2. egyáltalán mitől lehet ez ? megoldás ?
- vlmi acpi funkció bugzik be éjjel lakapcsolja és nem tudja reggel elinditani ?
- ha HDD hiba (eddig mindig ugyanarra sda-ra irta) akkor miért mindig ugyanakkor jön elő ? és miért nem jelzi a bekapcsolt SMART ? meg a BIOS es miert lehet hibanelkul ujra szinkronizalni ?
- attók hogy egyik hdd-re I/O error van miert hal meg utána egész SATA busz ? (mar ha erről van szó...)

Hello,

A S.M.A.R.T. SATA HDD-kre még nincs elkészítve, de már dolgoznak rajta. Ezt távolítsd el, lehet hogy ott lesz a baj.

Pontosítok, nem minden SATA vezérlő támogatja a S.M.A.R.T.-ot SCSI driveren keresztül. Ez talán okozhat problémát. Használod a smartmontools-t?

[quote:a3e1ffe8e4="FeriX"][quote:a3e1ffe8e4="FeriX"][quote:a3e1ffe8e4="vajtsz"]

HDD-k SATA-k. kernel 2.6.11, sata vezérlő 1 LSI INtel lapon

Ami nem világos :

2. egyáltalán mitől lehet ez ? megoldás ?
- vlmi acpi funkció bugzik be éjjel lakapcsolja és nem tudja reggel elinditani ?
- ha HDD hiba (eddig mindig ugyanarra sda-ra irta) akkor miért mindig ugyanakkor jön elő ? és miért nem jelzi a bekapcsolt SMART ? meg a BIOS es miert lehet hibanelkul ujra szinkronizalni ?
- attók hogy egyik hdd-re I/O error van miert hal meg utána egész SATA busz ? (mar ha erről van szó...)

Hello,

A S.M.A.R.T. SATA HDD-kre még nincs elkészítve, de már dolgoznak rajta. Ezt távolítsd el, lehet hogy ott lesz a baj.

Pontosítok, nem minden SATA vezérlő támogatja a S.M.A.R.T.-ot SCSI driveren keresztül. Ez talán okozhat problémát. Használod a smartmontools-t?

Nem tudok róla, így "nem" re szavazok (hacsak sarge alapbol nem teszei be/időzíti mittomén) utánanézek....

[quote:83ee070b2f="vajtsz"][quote:83ee070b2f="FeriX"][quote:83ee070b2f="FeriX"][quote:83ee070b2f="vajtsz"]

HDD-k SATA-k. kernel 2.6.11, sata vezérlő 1 LSI INtel lapon

Ami nem világos :

2. egyáltalán mitől lehet ez ? megoldás ?
- vlmi acpi funkció bugzik be éjjel lakapcsolja és nem tudja reggel elinditani ?
- ha HDD hiba (eddig mindig ugyanarra sda-ra irta) akkor miért mindig ugyanakkor jön elő ? és miért nem jelzi a bekapcsolt SMART ? meg a BIOS es miert lehet hibanelkul ujra szinkronizalni ?
- attók hogy egyik hdd-re I/O error van miert hal meg utána egész SATA busz ? (mar ha erről van szó...)

Hello,

A S.M.A.R.T. SATA HDD-kre még nincs elkészítve, de már dolgoznak rajta. Ezt távolítsd el, lehet hogy ott lesz a baj.

Pontosítok, nem minden SATA vezérlő támogatja a S.M.A.R.T.-ot SCSI driveren keresztül. Ez talán okozhat problémát. Használod a smartmontools-t?

Nem tudok róla, így "nem" re szavazok (hacsak sarge alapbol nem teszei be/időzíti mittomén) utánanézek....

alapból nem megy fel. Ne keresd.

feltettem ezta smartmontools nevu cuccot demost beiizitsam avagy ne mert ezaz ami nem támogatja SATA-kat ?

[quote:a2fb99f0ba="vajtsz"]feltettem ezta smartmontools nevu cuccot demost beiizitsam avagy ne mert ezaz ami nem támogatja SATA-kat ?

ugyolvastam hogy nem támogatja, igy nemteszemfel... (jol olvastam ???)

Nah "hurrá" :(((((((
mostmár napközben, munka közben is sikerült megcsinálni neki a kunsztot :(
Ha csak HDD rossz miért fagy le egész koceráj ??? vagy mi lehet a gond ???

HELP VLKI !!!!

Hali

feltettük az 2.6.11.5 kernelt és kisebb modositasokat csináltunk benne (kivettünk minden létezo ACPI meg ilyesmiket) meg volt vlmi SATA driver (nem a scsi eszkozoknel ahol tobbi sata van) amihez azt irtak hogy libata driverrel conflictolhat, aztis kivettuk. Ezekután restart ment minden szépen és unnep+hetvege leven azt hidtuk minden szép és jó.

De reggel kiderült hogy igaz hogy a szerver megy szépen de RAID ből megint kivágta egyik sata HDD-t csak most legalább tovább ment gép másik HDD-ről az error hasonló korábbihoz :

[code:1:d501601ba7]
kernel: ATA: abnormal status 0x80 on port 0xE407
last message repeated 2 times
kernel: ata1: status=0x80 { Busy }
kernel: SCSI error : <0 0 0 0> return code = 0x8000002
kernel: sda: Current: sense key: Aborted Command
kernel: Additional sense: Scsi parity error
kernel: end_request: I/O error, dev sda, sector 155268031
kernel: md: write_disk_sb failed for device sda1
kernel: ATA: abnormal status 0x80 on port 0xE407
.... ez sokszor....
kernel: RAID1 conf printout:
kernel: --- wd:1 rd:2
kernel: disk 0, wo:1, o:0, dev:sda1
kernel: disk 1, wo:0, o:1, dev:sdb1
kernel: RAID1 conf printout:
kernel: --- wd:1 rd:2
kernel: disk 1, wo:0, o:1, dev:sdb1
[/code:1:d501601ba7]

Nahmost restart után már BIOS sem látta HDD-t de egy másik gép simán látta, mi lehet a problem ? ALAPLAP-HDD ? hogy lehetne egyiket-másikat tutira kizárni ?

Megoldódott a problémád?
Ha igen, hogyan, engem is érdekelne.