Kernel panic eros HDD terheles eseten

Merevlemezek, vezérlők

Konfiguracio:
Intel DH57JG lap, i3-540 CPU, 2x2G Corsair RAM, 3x1.5 TB Samsung Ecogreen F3 HDD, ebbol sdb/sdc RAID1-ben.
OS: Debian Squeeze
A RAID vezerlest az alaplapi kontroller + mdadm vegzi. Az mdadm verzio ebbol kovetkezoen 3.1.3 (az Ubuntuban meg jelen levo 2.6.3-as mdadm nem kezeli nativan az Intel Matrix Storage Managert.)

Jelenseg:
Ha valamelyik koteten eros terheles van (pl. a RAID1-es kotetrol tar-olok fajlokat az sda-ra), akkor idonkent kernel panicot kapok. Sajnos a panic log meg nincs meg, megprobalom netcattal megoldani este (ha sikerul reprodukalni).

Egyeb informaciok:
Az egesz ejszakas memtest86 teszt 0 hibaval zarult.

Kerdes:
Van valakinek otlete?

A "ne hasznalj Linuxot" kevesse hasznos, jo ok van arra, hogy miert pont az van a gepen, es nem Windows vagy BSD.

Koszi.

2134 megtekintés

mdadm helyett dmraid esetleg?
(egyébként nem is tudtam, hogy már mdadm is tudja kezelni a matrix bigyót, de most megnéztem és tényleg.)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ez nekem is eszembe jutott, de kicsit fajdalmasnak tunik; az mdadm bovebb funkcionalitasu, pont emiatt valaszottam testing Debian verziot.

Egyebkent home serverrol / media centerrol van szo, nem uzletileg kritikus geprol.

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

Hát vagy a másik lehetőség, hogy soros porton nullmodem kábellel összedugod másik géppel, kernelnek ttyS0-t, konzolnak, másik gépen minicom vagy valami figyel...
Egyébként így minden info nélkül, lehet a hiba simán hardvertől is (vezérlő, hdd, cpu cache, vagy akár memória is)
--
Discover It - Have a lot of fun!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Igen, logot megprobalok majd csinalni. Hardverhibat nagyon nem szeretnek, az maceras lenne; a memoriat ugye tobbe-kevesbe kizarhatjuk (a memtest miatt). Lehet, hogy kikapcsolom az alaplapi vezerlot, es hasznalok sima softraidet, meglatjuk, mi lesz.

----------------------
while (!sleep) sheep++;

1 szavazat

A hozzászóláshoz be kell jelentkezni

Előtte esetleg egy long smart self test a hddkre...
--
Discover It - Have a lot of fun!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Epp most fejezodott be az sda es sdb tesztje (reggel beinditottam).

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed without error 00% 146 -

Egyebkent siman intenziv merevlemez-aktivitassal nincs gondja -- multkor aramkimaradas (khm..) miatt resyncelte a teljes tombot, kb. 3 oraig tartott, semmi problema nem tortent. Kifejezetten akkor van gond, ha a RAID tombre/tombrol masolok.

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

Akkor sztem az mdadm - intel matrix közti kommunikáció probléma lesz, szóval sima szoft raiddel is ki kellene próbálni.

0 szavazat

A hozzászóláshoz be kell jelentkezni

+1 a sima softraid-nek, az alaplapi vezérlő nemsokat segít szerintem a raid-nek és az i7-es CPU meg körberöhögi a RAID5-ös számolgatást valszin. Az is a softraid mellett szól, ha már nincs rendes raid kártya, hogy egyszerűbb tetszőleges másik gépen összerakni a tömböt.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Raadasul nincs is RAID5-os tomb, csak sima mirror. Az alaplapi vezerlo arra lenne jo, hogy ha esetleg OS-t cserelek, akkor latja majd a masik is (mondjuk a Windows eleve nem olvas ext4-et).

Tenyleg, a fajlrendszer ext4.

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

Az ext4-el nem hiszem, hogy gondod lesz bár még jönnek hozzá a bugfixek sorban, de az Ubuntuban levő kernellel használom egy 6x2TB-os RAID5-el (backup gép) és sok hónapja megy. A 3x1,5TB-ot érdemes úgy felosztani hogy 3 darab kisebb partició raid1-ben (vagy két partició+hotspare) és a három nagyobb partició pedig raid5-ben. (A particiók pontos száma nyilván ízlés és szükség kérdése, ez csak alapötlet.)

Ha OS-t cserélsz, akkor szerintem totálisan mindegy lesz, mert új FS-t akarsz rátenni.

0 szavazat

A hozzászóláshoz be kell jelentkezni

nem tudom, mi a fájdalmas benne, de én sokat használom a dmraid-et (igaz én csak raid0-t használok) és lekopogom, még soha nem volt vele semmi gondom. gondolom a megbízhatóság megér annyit, hogy a "fájdalmasságot" elviseld :)
de legalább egy próbát megérne, aztán ha azzal működik, akkor mehet az mdadm-ről a bugreport.
vagy esetleg kapcsold ki a raid romot, és csinálj tisztán szoftveres raid-et mdadm-el.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Koszi. Azt nem tudod veletlenul, hogy ha kikapcsolom a BIOS alapu RAIDet, akkor az mdadm osszecsinalja-e magat?

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

Valószínü.
Hadd kérdezzem meg ,hogy milyen tipusu diszkek vannak a tömbben ?
Nekem a WD black-kal állandó random problémáim voltak kernel panic is.
Windows XP alatt is problémás volt.
Azóta az egyik disk megadta magát láthatólag minden ok nélkül.
Most Samsungok vannak ugyan ott és azóta nincs hiba. (3 hete) .....?
Az is igaz hogy azóta a vezérlőn nincs single disk.
Gondoltam arra is ,hogy nem bios hiba e mert esetleg a RAID módban gondja van a single diszkel.
Alaplap GA-H57M-USB3.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Samsung EcoGreen F3 1.5 TB (HD153WI).

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

SAMSUNG 1000GB F1 7200rpm 32MB SATA2 HD103UJ
Ezekkel nincs gond.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Elvileg egyikkel sem kellene, h gond legyen :) (A 7200 rpm egyebkent is kizart nalam, tekintve, hogy media center / storage, tehat alacsonyfogyasztasu gep lett.)

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

Update:
Megjött a WD black a gariztatásból.
Beteszem ugyan úgy eszi a fene pedig most nincs single diszk.
Bios update után ugyan az a gond linux alatt , de WIN XP alatt mostmár stabil.
Ugyanezek a diszkek stabilan mennek GA-MA78GM lappal.
Köcsönkértem egy GA-H57M-USB3 rev2 lapot és azzal kigyógyult.
Most valami hackelt biost keresek ami javítja az intel raid matrix firmware-jét.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Érdekelne, ha valakinek van ilyen irányú tapasztalata.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Kikapcsoltam. Az fsck sir, hogy a superblock ervenytelen (nyilvan, hiszen az alaplapi firmware kinullazza, amikor kikapcsolod), viszont az mdadm tokeletesen latja a tombot es az adatokat is.

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ezer köszönet!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Valószínűleg disk firmware lehet az oka.
Volt olyan tapasztalat bizonyos Samsung vinyókkal (EcoGreen F4), hogy terhelés alatt random resetelték magukat ás eldobálták az adatokat.
Állítólag a queue depth-el függött össze a dolog, én nem szórakoztam a probléma kimérésével, hanem kapásból kicseréltem az összes vinyót.
A dmesg-ben drive reset-re vagy timeout-ra keresgélj, talán nyomra vezet.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Megnezem (gyonyoru lenne. :( )

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

Sima mdadmmal is megfekszik. Itt a kep:

http://picasaweb.google.com/lh/photo/g7saCpSFfjK1IxmmiTKLYMpNKk3U0XMHg6…

Meg kap egy eselyt a dmraid, aztan Windows. Elotte persze tesztek.

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

Hova tűnt a Debian Squeeze? :)

Ez a panic olybár tűnik, mint egy hardverfüggetlen kernelhiba. 2.6.35 -re még nem tértem át sehol, egyebet nem tudok elmondani.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ez mar Ubuntu Server. A Debian Squeeze ugyanezt produkalta.

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ez kernelhibának tűnik. Próbálj másik kernelt.
--
Discover It - Have a lot of fun!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ebből nem sok mindent látok.
Nincs valami szöveges copy-paste?
Vagy másik kép?
---
Memória feszültség rendesen be van állítva?
(Eseteleg ha nem kell a com-port, akkor tiltsd le)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Minden alapbeallitason megy.

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ha most a fentiek alapján nem megy a hw raid, akkor is leakad?

0 szavazat

A hozzászóláshoz be kell jelentkezni

Akkor is. Viszont dmraid-del eddig eleg jol megy, attoltam mar kb. 500 GB adatot a tombre.

Egyeb eszrevetelek: a sima softraid 2x-3x annyi prociidot igenyel, mint a firmware-tamogatott, hiaba csak fakeraid az alaplapi.

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

Naná, hogy cpu-igényes: valakinek azt a rahedli xor-t meg kell csinálnia :-) - vagy a cpu-nak, vagy a raid chipnek. Ráadásul a fizikai i/o-ban sem mindegy: az átlagos alaplapi raid vezérlőnek elég egyszer kiküldeni a kiírandó adatokat, ő majd továbbtolja a két diszkre (sima tükör esetén), míg a fullos szoftraid-nél a két diszket külön kell etetni.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Mivel debian alatt az ext4 lesz az alap, a hétvégén
átkarcolom és megnézem hw-raides kártyával ezt a szitut(bár az nem alaplapi).

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ja, valtottam ext3-ra, tehat nem tokeletes a kiserlet. :)

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

while (!sleep) step--;
akkor első körben marad az ext3.

0 szavazat

A hozzászóláshoz be kell jelentkezni

memtest, cpubourn volt már?

hátha máshol van a baj

0 szavazat

A hozzászóláshoz be kell jelentkezni

Memtest volt, egy ejszakan keresztul. CPUBurn meg csak rovid ideig.

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

MPRIME 5 oran keresztul ment, tokeletes. Azota is tolom ra a bajtokat, dmraiddel semmi hiba.

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

és nem fájdalmas? :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Friss hozzászólások

Annyi helyen láttam már… 2025-09-17T05:55:28+0200
Valóban, ezt elszúrtam… 2025-09-17T05:41:48+0200
Valóban, ezt elszúrtam… 2025-09-17T05:41:46+0200
tök mindegy

Nem, a Tisza… 2025-09-17T05:05:27+0200
"Off: Egy bizonyos Welsz… 2025-09-17T04:17:10+0200
Nothing Else Matters -… 2025-09-17T04:02:05+0200
A különbség látszólag az,… 2025-09-17T03:53:40+0200
Ez a cikk több oldal hosszú,… 2025-09-17T01:00:54+0200
azt hittem a birkákkal lesz… 2025-09-17T00:46:29+0200
Úgy a jó! 2025-09-17T00:37:12+0200

Kernel panic eros HDD terheles eseten

Hozzászólások