Ubuntus server 6.10 - ismeretlen fagyás

Fórumok

Sziasztok!

Van egy csak helyi hálón használt fabrikszerverem. A vas alapvetően csak hobbi célra használható. (Abit SA7 (sis), integrált RTL8100, celeron 1,7, 512Mb ram két modulban, agp-s rage pro
)
Ubuntu 6.10 server változatát telepítettem LAMP opcióval, semmi komplikálás. Ami fut: mysql, apache, php5, ,phpmyadmin, wu-ftpd, egroupware 1.2.105, phpsysinfo. Mindent csomagból.

Terhelés gyakorlatilag nincs, az egroupware-t használnák.

A teljes szervert újratelepítettem egy másik ugyanilyen vason, de azon is változatlanúl megáll 1-2 napon belül.

Ha fagy akkor teljesen, de a putty csak akkor száll el ha újraindítom a szerkezetet, de persze előtte se reagál. Monitoron semmi. A fagyások közt eltelt idő nagyon összevissza, van hogy majdnem egy hét, de van hogy csak pár óra.

Nem tudom eldönteni hogy a vas pusztul el vagy valahol a szoftver.

Próbálkoztam acpi=off noacpi grub opcióval indítani, de nem vált be.

Másik csomagból telepített kernellel is megállt.

Logokban hibát, figyelmeztetést nem láttam, bár nem is tudom mit kellett volna látniom...

Mit nézzek? Mivel próbálkozzak? Valami stressz teszt?

Köszönöm!
Oli

Hozzászólások

vmstat és sar valamilyen logfile-ba, aztán akkor azt lehet elemezni.
Én erősen gyanakodnék egy nagyon magas load-ra, hogy még belépni sem tudsz. Azt is csinálhatod, hogy egy top-ot kinthagysz a terminálon, aztán ha csontrafagy az egész, legalább látod, hogy milyen volt a load, a process-ek hogy álltak.

Linux egroupware 2.6.17-10-server #2 SMP Tue Dec 5 22:29:32 UTC 2006 i686

The programs included with the Ubuntu system are free software;
the exact distribution terms for each program are described in the
individual files in /usr/share/doc/*/copyright.

Ubuntu comes with ABSOLUTELY NO WARRANTY, to the extent permitted by
applicable law.
Last login: Wed Apr 11 10:41:34 2007 from oliver.redcao.hu
oliver@egroupware:~$ top
top - 14:12:50 up 2:29, 2 users, load average: 0.02, 0.04, 0.01
Tasks: 56 total, 1 running, 55 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.0%us, 0.0%sy, 0.0%ni, 99.7%id, 0.0%wa, 0.0%hi, 0.3%si, 0.0%st
Mem: 515892k total, 301416k used, 214476k free, 21424k buffers
Swap: 1510068k total, 0k used, 1510068k free, 128176k cached

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
1 root 16 0 1632 536 448 S 0.0 0.1 0:01.46 init
2 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/0
3 root 34 19 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/0
4 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/0
5 root 10 -5 0 0 0 S 0.0 0.0 0:00.00 events/0
6 root 10 -5 0 0 0 S 0.0 0.0 0:00.03 khelper
7 root 12 -5 0 0 0 S 0.0 0.0 0:00.00 kthread
9 root 10 -5 0 0 0 S 0.0 0.0 0:00.00 kblockd/0
10 root 20 -5 0 0 0 S 0.0 0.0 0:00.00 kacpid
11 root 20 -5 0 0 0 S 0.0 0.0 0:00.00 kacpi_notify
95 root 10 -5 0 0 0 S 0.0 0.0 0:00.00 kseriod
128 root 20 0 0 0 0 S 0.0 0.0 0:00.00 pdflush
129 root 15 0 0 0 0 S 0.0 0.0 0:00.00 pdflush
130 root 25 0 0 0 0 S 0.0 0.0 0:00.00 kswapd0
131 root 20 -5 0 0 0 S 0.0 0.0 0:00.00 aio/0
1606 root 10 -5 0 0 0 S 0.0 0.0 0:00.00 khubd
1664 root 10 -5 0 0 0 S 0.0 0.0 0:00.04 kjournald

Ez maradtt a puttyon ... és megfagyott minta a ****

Helyileg sem tudsz belépni, vagy arra nincs lehetőséged?
Milyen hálókártya van a gépben? A fagyás után pingetni lehet vagy esetleg egy nmap?
Ja látom, integrált rtl szutyok. ifconfig nézd meg, hogy nincs -e túl sok elvesztett csomag.
Rakd még fel a smartmontools -t és ha "szerencséd van" akkor meglesheted a hdd -k állapotát.
Ha ATA vagy SATA , akkor így:
smartctl -d ata -a /dev/hda vagy sda vagy az aktuális eszköznév.
Meg azért megpróbálnám más alkatrészek cseréjét ideiglenesen, mint a VGA, táp is.
___________________________________________________________________
Lógnak a pálmafán a kókuszok .... :)
http://laszlo.co.hu/

helyileg nem reagál semmire, fekete lépernyő és kész
fagyáskor se ping se semmi
ata vinyó, smart rendben, vinyót is cseréltem az újratelepítésnél
kapott új tápot
... holnapra kiderül hogy mizu
de nem igazán tetszik a 150m swap, igaz csak 128m ramot hagytam benne

az a bajom hogy nem tudom hogy a vasacska teljesen szar, vagy a szoftver oldalon nyírja ki valami a vacakot. gépcsere megvolt, de sajna csak egy ugyanilyen szemetem van késznél ... meg egy p3 900-as valami, de ha a mostani ramcsere se hat akkor megy a p3-ra, abban meg minden elem más ...

a két gép közt csak a memória azonos, de elméletileg nem hibás ... most bettetem egy másikat, hátha ...

Ilyen nekem is volt, átálltam 386-os kernelre generic helyett és csak akkor csatlakoztatok külső eszközöket(pl. nálam, ha bluetooth sokáig benn volt fagyott, bár most a feisty beta már nem) ha szükségem van rá.
Esetleg futtass le egy memtest-et. Ha hibákat talál nem feltétlen rossz a memória, lehet BIOS beállítás is ami okozhatja.

teljesen safe módban is fagyott .. a memtest meg 3 óra alatt se hibát nem talált, se fagyást

kollégám szerint forgassunk egy újabb kernelt alá ... hát ha nem muszáj, de itt a hibakeresés lenne a lényeg, mert bár nem használjuk "élesben" de hamarosan szükség lesz rá, így nem szeretném hogy azon csússzon el a dolog hogy fagy a vas, persze ha beválik vetetek alá egy használjató szerkezetet, de először legalább azt el tudják dönteni hogy kell-e nekik

Ubuntu comes with ABSOLUTELY NO WARRANTY, to the extent permitted by
applicable law.
Last login: Wed Apr 11 14:49:11 2007 from oliver.redcao.hu
oliver@egroupware:~$ top
top - 09:01:53 up 18:13, 1 user, load average: 0.03, 0.09, 0.04
Tasks: 51 total, 2 running, 49 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.0%us, 1.0%sy, 0.0%ni, 79.7%id, 19.0%wa, 0.3%hi, 0.0%si, 0.0%st
Mem: 126044k total, 123676k used, 2368k free, 488k buffers
Swap: 1510068k total, 159612k used, 1350456k free, 10388k cached

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
72 root 15 0 0 0 0 D 0.7 0.0 0:03.29 kswapd0
3424 www-data 16 0 31452 9132 2692 D 0.3 7.2 1:36.65 apache2
1 root 17 0 1628 224 224 S 0.0 0.2 0:01.36 init
2 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/0
3 root 34 19 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/0
4 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/0
5 root 10 -5 0 0 0 S 0.0 0.0 0:00.00 events/0
6 root 10 -5 0 0 0 S 0.0 0.0 0:00.03 khelper
7 root 10 -5 0 0 0 S 0.0 0.0 0:00.01 kthread
9 root 10 -5 0 0 0 S 0.0 0.0 0:00.00 kblockd/0
28 root 10 -5 0 0 0 S 0.0 0.0 0:00.00 kseriod
73 root 20 -5 0 0 0 S 0.0 0.0 0:00.00 aio/0
1551 root 10 -5 0 0 0 S 0.0 0.0 0:00.00 khubd
1609 root 10 -5 0 0 0 S 0.0 0.0 0:00.16 kjournald
1675 root 15 0 1600 268 268 S 0.0 0.2 0:00.01 logd
1761 root 20 -4 2184 216 216 S 0.0 0.2 0:00.65 udevd
2455 root 13 -5 0 0 0 S 0.0 0.0 0:00.00 kpsmoused

utoljára ez maradtt a puttyon, olyan mintha abban a pillanatban fagyott volna le amikor leültem a gépem elé, megnézni hogy mi van ezze a trutyival. új telepítés, másik szutyokra és megnézem hogy mit produkál ott ... elképzelhető hogy exchange lesz a vége, remélem ...

Üzemeltet valaki egyáltalán élesben egroupware-t ????????????????

megpróbálkozok egy 2.6.17-11-386 kerlellel is .. hátha

noapic noacpi kernel opciókombót próbáltad?

próbáltam, és próbálom indításkor a acpi=off noacpi apciókat.

most 386 kernellel zötyög ... de nem értem hogy adott oldal generálási ideje hogy változhatott meg 1,2 másodpercről 0,8 ra ... kernelcsere miatt?? nem értem, zötyög lefele egy 7.04 server beta ... próba cs ertesznye

az egroupwareból is van újabb, de nincs belőle csomag, és még mivel nem biztos hogy az a döglött, nincs sok kedvem heggeszgetni, mégha annak frissítése nem egy nagy gond, de akkor is

Próbáljunk meg egy olyat is, hogy nem putty-on nézel top-ot, hanem a console-on. Mert mi van, ha először mondjuk dobja a netet (kintmarad a top-od a putty-on), aztán még utána fél órát zötyög és más miatt hal meg. És mondjuk jó lenne egy vmstat -n 5 >> /var/log/valami.log mellé.

a console is kihal, fekete képernyő, mivel kikapcsolja, ott se reagál semmire ... egyszerűen méjfagyasztódik a szerkezet ... most a 386os legfrissebb csomagkernellel megy ... már van 9 óra uptime :P
a net nem érdekes mer helyi hálós másik gépen maradtt rajta ...
a vmstat tipped beadagolom .. hátha lesz használható információ tartalma

nincs tapasztalatom, de akarok. a kollégám jártas linux szerver üzemeltetésben, neki sarge megy megállás nélkül majd máfél éve egy ilyen szemeten. ő kernelforgatást javasolt, hamarosan azt is ki kell próbálni ... cserélgetünk minden hardver elemet, de mindig fagy .. viszont ha hálókártyát cserélek akkor nem hajlandó menni a háló, sőt amikor a vinyót átraktam egy másik ugyanolyan gépbe ami teljesen ugyanolan, ott sem volt hajlandó hálót kezelni, dmesg ben benne van hogy megtalálta, de se static, se dhcp módban nem hajladó menni, ifup esetén meg dobálta az üzeneteket hogy nincs hárdver, vagyis ő már nem látta az eth0 annak ellenére hogy a dmsegben szépen látszott, ez akkor sem változott amikor a modult kézzel betöltöttük, kilőttük, betötltöttük .. stb

eddig is köszönöm a segítségeteket, remélem lesz megoldása

ismét a szerkezet közelében leledszem.

próbáltam egy másik dolgot. úgy indítottam hogy kitöröltem a grub sorából hogy quiet és a splyasht átirtam nosplash-re. nem tudom hogy mit kéne várnom tőle, de így a szokásos beszédes indítást látom, mivel alapból az bui elég halgatag. és az egész egyszerűen megáll ott hogy

*Running local boot scripts (/etc/rc.local) _

a sor végén villog a kurzol. ugyanezt csinálja *-generic és *-server végü csomag kerlenél is

az rc.local taralma ki van kommentezve kivéve egy exit 0 sor

a tty2-re és ssh ra is van login, a tty1-en egy enter ütése után is kérne logint, de magától nem lép tovább

paff ... cat man rc.local > oli :)

login as: oliver
oliver@192.168.1.199's password:
Linux egroupware 2.6.17-11-generic #2 SMP Tue Mar 13 23:32:38 UTC 2007 i686

The programs included with the Ubuntu system are free software;
the exact distribution terms for each program are described in the
individual files in /usr/share/doc/*/copyright.

Ubuntu comes with ABSOLUTELY NO WARRANTY, to the extent permitted by
applicable law.
Last login: Mon Apr 16 09:59:06 2007 from oliver.redcao.hu
oliver@egroupware:~$ sudo mc
Password:

oliver@egroupware:~$ sudo reboot

Broadcast message from oliver@egroupware
(/dev/pts/0) at 10:18 ...

The system is going down for reboot NOW!
oliver@egroupware:~$ login as: oliver
oliver@192.168.1.199's password:
Linux egroupware 2.6.17-11-server #2 SMP Tue Mar 13 23:33:44 UTC 2007 i686

The programs included with the Ubuntu system are free software;
the exact distribution terms for each program are described in the
individual files in /usr/share/doc/*/copyright.

Ubuntu comes with ABSOLUTELY NO WARRANTY, to the extent permitted by
applicable law.
Last login: Mon Apr 16 10:16:40 2007 from oliver.redcao.hu
oliver@egroupware:~$ sudo top
Password:
top - 11:13:34 up 54 min, 1 user, load average: 0.06, 0.05, 0.05
Tasks: 49 total, 2 running, 47 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 255988k total, 157224k used, 98764k free, 3876k buffers
Swap: 1510068k total, 0k used, 1510068k free, 44132k cached

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
1 root 15 0 1628 536 448 S 0.0 0.2 0:01.42 init
2 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/0
3 root 34 19 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/0
4 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/0
5 root 10 -5 0 0 0 S 0.0 0.0 0:00.01 events/0
6 root 10 -5 0 0 0 S 0.0 0.0 0:00.01 khelper
7 root 13 -5 0 0 0 S 0.0 0.0 0:00.00 kthread
9 root 10 -5 0 0 0 S 0.0 0.0 0:00.00 kblockd/0
10 root 20 -5 0 0 0 S 0.0 0.0 0:00.00 kacpid
11 root 20 -5 0 0 0 S 0.0 0.0 0:00.00 kacpi_notify
93 root 10 -5 0 0 0 S 0.0 0.0 0:00.00 kseriod
124 root 20 0 0 0 0 S 0.0 0.0 0:00.00 pdflush
125 root 15 0 0 0 0 S 0.0 0.0 0:00.00 pdflush
126 root 25 0 0 0 0 S 0.0 0.0 0:00.00 kswapd0
127 root 20 -5 0 0 0 S 0.0 0.0 0:00.00 aio/0
1668 root 10 -5 0 0 0 S 0.0 0.0 0:00.02 kjournald
1753 root 15 0 1604 548 468 S 0.0 0.2 0:00.02 logd
1861 root 17 -4 2188 572 344 S 0.0 0.2 0:00.47 udevd
2599 root 14 -5 0 0 0 S 0.0 0.0 0:00.00 kpsmoused
2602 root 15 -5 0 0 0 S 0.0 0.0 0:00.00 kgameportd
2617 root 20 -5 0 0 0 S 0.0 0.0 0:00.00 shpchpd
3198 root 16 0 1600 508 432 S 0.0 0.2 0:00.00 getty
3199 root 16 0 1596 504 432 S 0.0 0.2 0:00.00 getty
3200 root 16 0 1600 508 432 S 0.0 0.2 0:00.01 getty
3201 root 16 0 1596 504 432 S 0.0 0.2 0:00.00 getty
3202 root 16 0 1600 508 432 S 0.0 0.2 0:00.00 getty
3203 root 16 0 1600 508 432 S 0.0 0.2 0:00.00 getty
3239 root 15 0 1652 612 500 S 0.0 0.2 0:00.03 syslogd
3263 root 16 0 1724 512 420 S 0.0 0.2 0:00.05 dd
3265 klog 16 0 2412 1292 384 S 0.0 0.5 0:00.10 klogd
3307 root 25 0 1656 500 416 S 0.0 0.2 0:00.03 mysqld_safe
3371 mysql 15 0 125m 18m 4920 S 0.0 7.4 0:13.37 mysqld
3372 root 18 0 1584 524 456 S 0.0 0.2 0:00.00 logger
3456 root 16 0 4940 1068 728 S 0.0 0.4 0:00.01 sshd
3473 root 24 0 2284 688 496 S 0.0 0.3 0:00.00 wu-ftpd

itt a vas lesz a ludas, mert még a speeker se sípol ha fagyott állapotban ráülök a billre ...

most egy másik gép másik vinyó másik minden ( a billt még nem cseréltem .. legközelebb az jön :)
meglepő módon ugyanolyan oldalgenerálási időket produkál ( p3-933, 256mb )

egy szivola amit már legközelebb nem kapok be ( gondolom ez egy olyan minden kopasz megkapja dolog )
ghostoltam az egészet egy kissebb vinyóra, az eth0 nem reagált semmire ( másik hálókártya ) , se statikusan se dhcp vel mindig no cuxx device üzenetet kaptam, dmesg ben eth0:XXX valami megvolt, ezután udev, keresés, eth0, eth1 .. már nem tudom mi volt de a network/interfaces ben ami static megvolt adva az eth0-nak a korábbi szerkezetben azt megkapta az eth1, ifup eth1 és láss csodát már megy is ... mindegy, megy .. forróvizet a kopaszra!! :)
pontosan nem tudom még hogy mi miért történt .. ez még egy másik történet lesz.

a bootloadert így is újra kelett telepíteni, de valamiért a szellem megcserélte a két partíciót, így hda1 ből hda2 és fordítva lettek .. ezt a grub újratelepítése után még korrigálni kellett a menu.lst ben, de töltődik, megy, fut ... és most megy a várakozás hogy mi lehet .. ha ezen fut fagyi nélkül mondjuk 3 napig :) akkor a vast nevezem meg ludasnak és offtopicot sem bíró dolgokat teszek vele ... ( megkapja egy felhasználó win 98-al :)