Nagy a bajom, és hiába túrtam több órát a google találatait, még szívok.
Sata bus resetek vannak teljesen random módon (gondolom terheléstől is). Valamikor szétesik emiatt a zsoftveres raid 1 is, szóval elég para. A vinyók újak, most lettek cserélve, és a kábelekkel sincs gond. Akkor kezdett az egész jelentkezni, amikor etch-ről lenny-re frissítettem a rendszert (csak nemrég jutottam idáig, nem véletlen halogattam). A gép egy régebbi IMB e326m, két 250-es SATA hdd-vel.
Olvastam mindenfélét, hogy a kernelmodulok akadhatnak össze, a libata, és a régebbi pata modul. Azt nem tudom, mi hozna gyors és megynugtató megoldást, mert a mostani helyzet igen ingatag. 2.6.18-as és 2.6.26-2-es kernellel is ez a helyzet.
A ma éjszakám ezzel telt, és nincs még megoldás.
Kérlek titeket, mutassatok irányt!
Dec 8 06:30:51 ns1 kernel: [ 5427.057837] ata2.00: exception Emask 0x10 SAct 0x0 SErr 0x44050000 action 0xe frozen
Dec 8 06:30:51 ns1 kernel: [ 5427.057898] ata2: SError: { PHYRdyChg CommWake DevExch }
Dec 8 06:30:51 ns1 kernel: [ 5427.057934] ata2.00: cmd c8/00:08:af:9a:14/00:00:00:00:00/e7 tag 0 dma 4096 in
Dec 8 06:30:51 ns1 kernel: [ 5427.058041] ata2.00: status: { DRDY }
Dec 8 06:30:51 ns1 kernel: [ 5427.058075] ata2: hard resetting link
Dec 8 06:30:51 ns1 kernel: [ 5428.057103] ata2: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
Dec 8 06:30:51 ns1 kernel: [ 5428.081997] ata2.00: configured for UDMA/133
Dec 8 06:30:51 ns1 kernel: [ 5428.082036] ata2: EH complete
Dec 8 10:20:28 ns1 kernel: [20113.681530] ata2.00: exception Emask 0x10 SAct 0x0 SErr 0x44050000 action 0xe frozen
- 1296 megtekintés
Hozzászólások
Nekünk még memória hiba is csinált ilyet... szóval a jóég tudja ezeket. Okozta már WD diszk is.
- A hozzászóláshoz be kell jelentkezni
Pont van benne egy WD. :S
- A hozzászóláshoz be kell jelentkezni
red-hat és ubi-nál is volt ilyen gond, úgy néz ki, hogy
kernel.
https://bugzilla.redhat.com/show_bug.cgi?id=488371
http://ubuntuforums.org/archive/index.php/t-472056.html
ha ki akarod zárni a hdd hibát, akkor rá kellene kötni őket
egy sata kártyára.
(De feltehetted volna a squeeze-t is)
- A hozzászóláshoz be kell jelentkezni
Az új vinyó nem jelent semmit, nekem most volt a kezemben két, nullkilométeres roncs vinyó...
a sata kábelt is érdemes lehet megnézni, olyanból is volt már vadi új nem működő darabom... húzogasd meg, nem lötyög-e.
meg lehet táp is, főleg régebbi gépekben.
- A hozzászóláshoz be kell jelentkezni
vinyók smart-ja mit mond?
nekem pont ugyanezt csinálta egy vinyó (raid0-ban), és ott szépen nőtt a smartban az ecc errorok száma -> a sata kábel volt a ludas. (pedig nem volt kilazulva sehol)
- A hozzászóláshoz be kell jelentkezni
A smartd logokra rácsodálkoztam. ECC_error_recovered ugrált az előző vinyónál, amit azóta már kiszedtem, sőt, annak a párját is. Ezek kb. 3 évet mentek, 2 Seagate volt. Most a helyükre került két új vinyó (teljesen más típusú, nem egy széria - nem úgy, mint a két előd). Az az igazság, hogy a smart itt sem makulátlan, de ez a vezérlés bizonytalanságának tudható be szerintem. Az is igaz, hogy szinte mindig a második sata portot említi, tehát jó eséllyel adatkábel is lehet. Ennek csak az mond ellent, hogy a "testvér gép" is ugyanezeket a tüneteket produkálta. Szerintem arról lehet szó, hogy "régi" a gép (2005-2006-os modellek), és a vezérlője ütközik valamelyik kernel modullal. Bár ebben sem vagyok biztos. Főleg, mert már 2008-ban is jött elő ilyen hiba másnál google szerint.
Végülis arra jutottam, hogy a másik ilyen gépnél egy jó kis 3ware kártya megoldotta a problémát, arról nem beszélve, hogy hw-s raidet is ad. Így szerintem ez lesz a végső megoldás. Most az a helyzet, hogy néha csúnyábban resettel, és valamelyik raid tömb sdb-s felét ledobja, amit utána visszacsatolok. 2.6.18-as kernelnél rosszabb volt az egész, igaz ott libata 2.0 volt, 2.6.26-ban pedig libata 3. De egyelőre nem alszok nyugodtan...
- A hozzászóláshoz be kell jelentkezni
Köszi az ötleteket. Szörnyű az egész. Ennek előtte 600 napos uptime-ja volt a ketyerének minden gond nélkül. Most aztán nem is tudom miket nézegessek, de egyre többet vagyok az Ilka utcában... Ráadásul hostingos gép, egymagában szolgál ki mindent, nem is tudom mihez kezdjek vele, napközben full para, hogy szétdobja-e a raidet, esetleg nyom egy kis adatvesztést, éjszaka meg lehet töprengeni a megoldáson.
Van nálam még egy ilyen gép, szinte testvérek, az is ezt játsza, de ez még nincs élesítve, szóval nem annyira izgatott. Ebben mintha elmúlt volna a probléma azzal, hogy egy 3ware 9550-es kártya vezérli a két hdd-t, lehet ez lesz a megoldás...
- A hozzászóláshoz be kell jelentkezni
Csak azt nem tudom, hogy mi a csodának álltál meg a lenny-nél. Míg benne van az ember a frissítésben és nagyon jól tudja mit kell figyelni lehet két Debian verziót ugrani.
Három hónapja játszottam el egy gépen, igaz, hogy több mint egy napom ráment, de tudom, hogy jó ideig nem lesz gond...
Vagy mégis? Samba fura dolgokat művel :D
- A hozzászóláshoz be kell jelentkezni
Éles szervereknél nem vagyok az a kísérletező típus, jobban szeretem a tuti stabil kiadásokat. :)
- A hozzászóláshoz be kell jelentkezni
Értem, éles szervernél álmodozó típus vagy:)
- A hozzászóláshoz be kell jelentkezni