[Megoldva] Debian wheezy, 3.2.0-4-amd64, i5 Fagy

Fórumok

Sziasztok!

11.15-én raktam össze egy új konfigot, a máig eltelt idő idő alatt kb 4x-8x lefagyott, és mondanom sem kell mennyire idegesítő a jelnség.
A korábbi konfigom (szintén wheezy, x64, viszont lga775-ös architektúra) nem fagy.

konfig&Kernel:
Linux 3.2.0-4-amd64 #1 SMP Debian 3.2.35-2 x86_64 GNU/Linux
intel dz68db (bios friss) + i5 3570k (no tuning) + KHX1333C9D3B1K2/8G + WD1002FAEX-00Y9A0 + ctg-500-80p

Megfigyelések
Ahogy észrevettem random időközönként fagy.
Néha egyszerű _talán_ a facebooktól kifagy (iceweasel-ben jelenleg is 10+ tab van nyitva), néha munka közben. A legutolsó fagyásnál kimentem 5 percre, visszajöttem és meg volt fagyva a drága.
A fagyást követően a képernyővel semmi gond nincs, nem csikoz, nem pöttyöz, egyszerűen a rendszer nem reagál a billentyűzetre az egérre, és semmilyen visszajelzést nem látok a kijelzőn/HDD működés jelző LED-jén (igen be van kötve). A HDD halk -WD-re jellemző- kerregő hangját sem hallom.

Hiba felderítés
A syslog, kern, dmesg nem ír semmi különlegeset. A fagyás előtt nem került a logokba semmi furcsa, rendere a logok:


Dec 31 15:41:43 box dhclient: bound to 192.168.0.80 -- renewal in 8861 seconds.
Dec 31 16:10:11 box kernel: imklog 5.8.11, log source = /proc/kmsg started.

Dec 31 14:17:31 box kernel: [29861.544625] WARNING! power/level is deprecated; use power/control instead
Dec 31 14:17:31 box kernel: [29861.631328] usb 4-1.1: USB disconnect, device number 4
Dec 31 16:10:11 box kernel: imklog 5.8.11, log source = /proc/kmsg started.

dmesg | grep -i warn; dmesg | grep -i fail; dmesg | grep -i error
[   66.974705] warning: `VirtualBox' uses 32-bit capabilities (legacy support in use)
[    8.740889] [drm] MTRR allocation failed.  Graphics performance may suffer.
[   31.245806] EXT4-fs (sda6): re-mounted. Opts: errors=remount-ro

Megjegyzés
- Futott kb: Vbox (egy guest altatva, többi off), kb. 5 terminal ablak abbol 2 ssh-n belépve egy szerverre, 1 élő nfs kapcsoalt helyi szerverrel, skype, pidgin, dropbox, iceweasel (kb 15 tab), icedove.
- HDD 35 fokos, smart nem mutat semmi hibát (újra futtattam a SMART tesztet is), a HDD igaz nem új 11350 órát ment eddig, 232 indítva/leállítva, a rendszer terhelése a fagyáskor kb 0% volt.

Pár teszt
A mai naptol kezdve hagyom futni 3-4 napig, nem hibernálom, meglátom mi lesz
Jövőre futtatok egy memtestet.
ill 2x 1, 1,5 óra cpu/hdd/io stress teszt is lefut faygás nélkül.

Update1: MEMTest megvolt, s 0 hiba!
Update2: Egész este futott a gép, semmi fagyás. 20 perc facebook után ismét kifagyott! (előtte kb. 1 óra 1080p-s HD film nem ártott neki)
Update3: SATA kábelt cseréltem azért. ->>> Ha nem fagy többé ki ez a hiba mégsem ez a hiba oka, új kábellel is fagy
Update4: RAM feszültség: 1.57 V (normál értéken belül van, a kingston specifikációja mellett is 1,5V.on üzemel az adott időzítésekkel)
Update5: CPU feszültségek rendben, lásd leljebb

Van valami tippetek esetleg?

Köszönöm a segítségeteket!

Üdv.:
V007

Hozzászólások

Bő 1 óra cpu/hdd/io teszt után sem fagyott ki a gép (-c 10 -d 10 -i 6 --vm 5 --vm-bytes 64M)
CPU magok: 75 fokosak, HDD 40 fokos, load average: 32,95, 33,02, 32,46

A RAM-okat is dolgoztatja rendesen, és szintén nem fagy ki a PC

Hello

Nekem akkor volt ilyen amikor 8 GB RAM-ot tettem egy alaplapba és ahhoz, hogy stabilan működjön a gép emelni kellett a RAM tápellátásán most nem emlékszem, pár tized voltot. De az 4 x 2 GB-os felállás volt.
Random fagyás szerintem RAM gond.

mogyi

Hahó!

Mit szól a géped a stabil 6.0-ás sorozatú Debian-hoz?

A 7-es -- ha jól tudom -- még nem kapta meg hivatalosan a stabil címkét, így éles rendszerekben az óvatos használata javasolt...

Vagy -- ha mindenképpen a 7-est akarod használni -- miért nem próbálod ki az Aptosid-et vagy a CrunchBang-ot?

G.
============================================
"Share what you know. Learn what you don't."

A testinggel semmi komoly problémám nem szokott lenni (Etch óta a használok testinget). Ált. miután stabillá válik az adott verzió rá 3-4 hónapra váltok ismét testingre és így megy tovább. Így nem térnék vissza a 6-oshoz. A Debianon kívűl pedig nem jött be igazán egy disztró sem.
Viszont az aptosid-et majd kíváncsiságképpen felrakom egy virt. gépre.

Imho egy ilyen hibva miatt nem kell, nem szabad disztrót cserélni, a hiba okára kell fénytderíteni és megoldani azt.

imho akkor, amikor nem találni hw-es okot, nem zárja ki a testing-ből eredő hibát az, hogy eddig nem botlottál testing-es hibába...
imho azért egy másik disk+stable distro próba is a teszt részének kellene legyen... tehát a "hiba okára fényt derítés" folyamatának ez is része kell legyen.

Update: Mióta kicseréltem az adatkábelt, nem fagyott a gép. Nem értem... A kábel szinte használatban sem volt, csak ide-oda lett rakosgatva pár éven át.
A kábel csere után is kifagyott!!! Mégsem ez a hiba, tehát kizárható:
- kábel
- táp (már csak azért is, mert felgyeztem a start/stop értékeket, és a fagyás után nem nőt az érték többel mint kellene. Tehát nem szűnt meg a tápellátás az adott ágon, és ment tovább a HDD)
- memtest nem adott hibát a ramokra
- Win7 alatt nem faygott még ki a rendszer (igaz ott csak dokumentumot szerkesztek, és böngészek)
- logok üresek.

MI a gond??? :(

Mivel nem szeretnék a RAM-od életével játszani én azt mondanám előbb próbáld az 1,59-et.
Nálam az ASUS alaplapon a feszültség állításakor az értékek színesek voltak, sosem próbáltam a piros tartományban, csak a sárgában, de a végén megoldotta a problémám a fesz. növelés.

mogyi

Szia,

nézd meg a neten (ha nincs rajta fizikailag) a RAM-ok pontos beállításait, késleltetéseit, órajeleit (+ az ehhez rendelt feszültségeket) és állítsd be így, ne automatán. Esetleg egy kicsit magasabb feszültség beállításokkal.
A tápod is új? Érdemes lenne egy cseretáppal is megnézni.

Üdv!

Helyzetjelentés:
Nem akarom elkiabálni, de a 3.6-os kernellel nem vagy. Várok tovább, indítom újra a stress tesztet és kicsit meghajtom a virtuális os-eket is.