Debian 6 szerver fagy

Fórumok

Sziasztok,

Van egy szerverem Debian 6-al, ami routerként funkcionál.
Van rajta Webmin, rtorrent, samba, valamint a routerhez szükséges funkciók, illetve apache, mysql, php (webszerver).
Valamint egy Cisco AP van utána kötve.
Minden normálisan működik, a CPU nincs terhelve, mert nincs mi terhelné.
Viszont egyszer gondol egyet és megfagy, ilyenkor a két integrált lan kártya teljesen sötétlesz, egy led sem világit egyiken sem.
Monitort rákötve semmi, a monitor nem kap jelet.
A fagyások változóak van amikor megy 2-3 napig, van amikor 15 óra után fagy.
Log fájlokat olvastam de nem találtam semmit, persze nem nagyon értek a linuxhoz, szóval lehet, hogy nem jól néztem :)

Tudnátok segíteni kideríteni, hogy mitől fagy a gép?

Előre is köszönöm.

Hozzászólások

fagyások előtt telepítettél valami extra csomagot? Esetleg frissítés? (Torrent,php,apache,spl,kernel bármi). Előtte feltételezem jól ment. Meg kellene nézni mióta csinálja a fagyást,és hogy akörül volt-e bármi gond.

Memtest, másik táp, elsőnek ezeket próbálnám. Esetleg hogy mindig ugyanakkor fagy-e, pl. amikor a logokat tömöríti -> a cpu túlmelegszik és kampeca.

Alaplapon kondik nem púposodnak?
Ha a hálókártya így kiakad, az szinte biztosan nem sw probléma.
Szóval. Lap, táp, mem, hűtés, kábel, hdd... az ellenőrzési sorrend.

Ez a gép: http://www.tri-m.com/products/aaeon/emb9459t.html

A kondikat megnéztem nem púposak.

Raktam rá hűtést, az eredmények:

Hűtés előtt:

coretemp-isa-0000
Adapter: ISA adapter
Core 0: +33.0°C (crit = +90.0°C)

it8712-isa-0300
Adapter: ISA adapter
in0: +0.88 V (min = +0.00 V, max = +4.08 V)
in1: +1.78 V (min = +0.00 V, max = +4.08 V)
in2: +3.28 V (min = +0.00 V, max = +4.08 V)
in3: +2.88 V (min = +0.00 V, max = +4.08 V)
in4: +3.09 V (min = +0.00 V, max = +4.08 V)
in5: +2.19 V (min = +0.00 V, max = +4.08 V)
in6: +1.62 V (min = +0.00 V, max = +4.08 V)
in7: +2.94 V (min = +0.00 V, max = +4.08 V)
Vbat: +3.18 V
fan1: 0 RPM (min = 11 RPM)
temp1: +49.0°C (low = -1.0°C, high = +127.0°C) sensor = thermistor
temp2: +61.0°C (low = -1.0°C, high = +127.0°C) sensor = thermistor
temp3: +51.0°C (low = -1.0°C, high = +127.0°C) sensor = thermistor
cpu0_vid: +1.700 V

Hűtés után:

coretemp-isa-0000
Adapter: ISA adapter
Core 0: -3.0°C (crit = +90.0°C)

it8712-isa-0300
Adapter: ISA adapter
in0: +0.88 V (min = +0.00 V, max = +4.08 V)
in1: +1.76 V (min = +0.00 V, max = +4.08 V)
in2: +3.28 V (min = +0.00 V, max = +4.08 V)
in3: +2.88 V (min = +0.00 V, max = +4.08 V)
in4: +3.09 V (min = +0.00 V, max = +4.08 V)
in5: +1.52 V (min = +0.00 V, max = +4.08 V)
in6: +2.46 V (min = +0.00 V, max = +4.08 V)
in7: +2.93 V (min = +0.00 V, max = +4.08 V)
Vbat: +3.18 V
fan1: 8333 RPM (min = 11 RPM)
temp1: +28.0°C (low = -1.0°C, high = +127.0°C) sensor = thermistor
temp2: +40.0°C (low = -1.0°C, high = +127.0°C) sensor = thermistor
temp3: +29.0°C (low = -1.0°C, high = +127.0°C) sensor = thermistor
cpu0_vid: +1.700 V

itt igazából nem tudom, hogy melyik a CPU, mondjuk ha tippelnem kellene akkor a temp2.

a tápon lehet állítani ha alacsony lenne a feszültség.

Megnézem így hűtéssel, csak tényleg az a baj, hogy van amikor napokig megy fagyás nélkül.
Így aztán nem tudom mikor lehetne kijelenteni, hogy stabil :)

Köszönöm az eddig segítséget mindenkitől.

in5-in6-nál elég durva eltérések vannak, illetve Core 0: -3°C? Kihúztál valamit? Vagy mitől lett az -3? Kompresszort tettél rá? :D

A feszültségek tényleg nem valami bíztatóak, én a helyedben csinálték egy 10-15 perncenkénti mentést a sensors kimenetéről (gondolom ezzel csináltad), és egy idő után összehasonlítani. Valószínű, hogy a táp sem tökéletes. (ettől függetlenül még más hiba is lehet)

A feszültségekről szóló sensorsból nyert információk irrelevánsak.

A gépnek egy 12V-os táplálása van, nem néz ki réginek a lap, szolidnak kinéző kondenzátorok vannak rajta, és "industrial" jelzővel illetik.

A 12V-os tápra kell rámérni multiméterrel. Ha 12V nagyjából megvan akkor annyi. Attól még lehet a táp hibás, ezt egy prime95, memtester, vagy burnP6 ki tudja hozni.

A helyedben hálókártyát tennék bele. Lehetőleg Intelt.

A PCI-t párszáz forintért beszerezheted, egy mini-pci-st kell még szerezni vagy egy PCIe kártyát vagy risert, ami belemegy az alaplap slotjába. Gondolom elég 100Mbit.

Esetleg próbáld meg a power management-et kikapcsolni (már ha be van kapcsolva).

biosban van szokatlan beállítás?

Sziasztok,

A -3°C nem tudom mi, de nem, nem húztam ki semmit, és csak egy mezei venti van a lap fölött.

Az integrált lan-al mi a gond?

A gigabitre szükség van, az egész hálózat gigabites.

Bekúsztam a rack szekrénybe és megmértem, 12,61V jön le a tápról terhelés alatt (amikor megy a gép).

Power management nem hiszem, hogy be lenne kapcsolva, próbáltam utána nézni, hogy hogyan tudnám megnézni de nem találtam leírást, kezelőfelület az nincs (leszámítva a webmin-t).

A biosban is megnéztem a power managementet, de ott kivan kapcsolva.
Egyéb szokatlan beállítás nincs a biosban, leszámítva a háttérvilágítást meg ilyesmit, de azok is kivannak kapcsolva.

Nézd meg mekkora forgalom van a hálózati kártyákon és döntsd el, hogy teszt jelleggel tudod e futtatni 1-2 hetet 100Mbps-es kártyákkal. Ha tényleg ez a gond, akkor veszel egy risert az alaplapodnak, és teszel bele két rendes Gigabites kártyát.

A Realtekkel az a gond, ami már ezelőtt 10 éve is. Rengeteg féle kártya van (ahelyett, hogy 1-2 jó, referenciamodellt gyártanának mint az Intel) és ráadásul még a driver is rossz. Pont ilyen gondokat okozhat mint amivel te szórakozol. Ezért nem ajánlja senki nagy forgalmú alkalmazásokra (szerver, router).

A feszültség lehetne kisebb is, 12.6V az ATX spec szerint a felső határ.

Bocs hogy más topic-jában kérdezek, de nagyon hasonló az én bajom is.
Szintén debian 6 (64bit). PowerPC a szerverhotelben. (4magos intel, 8GB RAM.)
Megy hetekig, aztán megjelenik egy, majd később több "Protection fault" üzenet a dmesg -ben. Mindig más esik bele: hol munin, hol ftp, szóval rapszodikus. Mintha aknamező lenne, és véletlenszerű hogy ki lép aknára. Egyszercsak valami fontos dolog is így jár, mert kifagy az egész. Háló nincs, konzol sötét. Van hogy a konzol még megy, de a reboot parancs is, és a shutdown is hibaüzenet nélkül visszajön, és nem csinál semmit. Hard reset.

Memtest negatív.
Időben nem függ össze semmilyen telepítéssel, vagy csomaggal.

A megbízó szívesen cserélne bármit, de nem mindent. Várja hogy mutassak rá arra az eszközre ami szar.
Vajon alaplap, proci, vagy egyéb? Procit voksolnék, de nem vagyok HW szaki, nem tenném rá a havi fizetésemet. :)

---
"A megoldásra kell koncentrálni nem a problémára."