reboot/poweroff lefagynak

Fórumok

Van egy Asus N3150I-C alaplapra épülő szerverem.
Egy-két napnál hosszabb uptime után ha megpróbálom poweroff paranccsal lekapcsolni vagy rebootolni, a gép leáll, de nem kapcsol ki/nem bootol újra. Billentyűzet már nem él, de a gép áram alatt van.
Nincs valami ötletetek, hogy mi okozhatja?
Logban erre vonatkozó hibaüzenet nincs.
Az acpi on/off játékon túl vagyok, nem segített.
Sajnos macerás próbálgatni, mivel van, hogy két nap után sem akad ki, szóval nem igazán következetes.
Viszont jó lenne valami megoldás, mert reset gomb nincs a gépen, az erőszakolt kikapcs meg a hardvernek sem tesz jót és az idegeimnek sem :)

Hozzászólások

Ja, nem tudok szerkeszteni: nem tudom, van-e jelentősége, ubuntu 16.04 fut rajta, backportból felrakott kernellel hosszabb idő után jött csak elő (4.11-es vagy újabb kernellel volt, hogy három-négy nap után is lefutott a reboot), a 4.4-essel már másnap is képes fagyni.

Jogos, ezt már el is felejtettem: a 4.13-ból (ubuntu 16.04.3) hiányzik az ethernet kártyám drivere. Nem tudom fejből, valami rtl81xx, amit külön csomagból lehet felrakni a 4.4 alá, de az a 4.13 alatt nem ment. A 4.11 alverzióiban viszont volt hozzá támogatás, le kellett ezt a külön telepítettet tiltani. Szóval a 4.13-mal még nem tudtam használni.

A monitoron sincs semmilyen üzenet?
A billentyűzeten a num lock ledjét sem tudod ki-be kapcsolgatni?
Shutdown parancs kiadása után megjelenik az Ubuntu felirat?
És ha rögtön nyomsz egy esc-et?
A dmesg-ben sincs error/warning (induláskor vagy menet közben)?
Még esetleg acpi bejegyzéseket is érdemes lenne átnézni.

Nem csak az M$ számol furán... A Zinternet lenne ilyen gyors?
65% [62 Sources 1528 kB/6239 kB 24%] 3062 PB/s 0s

Nincs semmi a konzolon. Pontosabban, ha 4.4-es kernelt használok, akkor nincs, üres a monitor. Ha 4.1x, akkor meg a shutdown során megjelenő üzenetek láthatóak, hibaüzenet nélkül. A journal korrektül lezárva, üzenetek megegyeznek a hibátlan leálláskor láthatóakkal.
Logban vannak ugyan hibák, induláskor és leálláskor is, de egyik sem kapcsolható a problémához.

Halt-ra mit lép? Vagy az a poweroff-ot hívja meg? Jártam már így, szerintem acpi.

--
"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

Én BIOS-ra gyanakodnék. A legújabb van fent? Én mindenképpen az acpi boot opciók környékén keresgélnék. Egyébként ha a "quiet" opciót törlöd boot-kor, akkor minden üzenetet látni fogsz. Leállításkor is. (elvileg)

---------------------------------------------------------------
Ritkán szólok hozzá dolgokhoz. Így ne várj tőlem interakciót.

jó a tápod ???
rendes feszültségeket ad le ???
ha rossz a táp, nincs log ... jártam így ...
//a "véletlenszerű" leállás vashiba szokott lenni, elmelegedés, feszültségingadozás, púpos kondik stb...//
_____________________
www.pingvinpasztor.hu

Abból ítélve, hogy amikor működik, nincs vele gond, csak a poweroff/reboot döglik meg, úgy gondolom, igen, a táp rendben lehet.
Ez nem véletlenszerű, 4.4-es kernellel kb. két nap, újabbal nagyjából három-négy nap uptime-ot követően csinálja. Egyébként több, mint egy éve megy folyamatosan bekapcsolva.

Én úgy tudom, az ATX tápoknál van valamiféle jelzési mechanizmus, amivel a táp "kommunikál" a processzorral (chipsettel), nemrégiben olvastam erről valamelyik régebbi Intel chipset dokumentációjában, de kb. ennyi ragadt meg az egészből, mivel nem ezt az infót kerestem. :)

Simán lehet, hogy az ezt kiszolgáló elektronika elöregedett vagy meghibásodott a tápban, ezért mindenképp érdemes lehet a tápcserével próbálkozni, feltéve, hogy van a polcon tartalék tápod (ugye, van?)

Ha a tápcsere nem segít, akkor alaplaphiba is lehet sajnos. :(

Akkor gyári hibás a táp, mert ez a hiba első héttől kísért. Akkoriban elkönyveltem bios bugnak, reméltem, hogy javítják, de maradt minden. És közel egy éve nincs új bios. Asus support meg... nem tudom, be kell-e mutatni őket. ;)
Az alaplap könnyen lehet, hogy hibás/bugos, hasonló problémáról olvastam anno, csak megoldást/workaroundot nem tudott senki. :(

Járt nálam nemrégiben egy öreg (~10 éves) Lenovo laptop, ami kísértetiesen hasonló tüneteket produkált, igaz, azon Windows 7 volt és a hiba csak véletlenszerűen jött elő, kb. minden harmadik-negyedik újraindításnál, viszont ebben elég következetes volt a masina. :)

Elsötétedett a kép a Windows szabályos leállása után, és utána a gép "tetszhalott" állapotba került, amiből csak a power gomb hosszú nyomva tartásával lehetett kibillenteni.

Próbáltam drivereket frissíteni, semmi változás. Felraktam egy újabb BIOS-t is, de az sem segített. Neten rákeresve nem tűnt úgy, hogy ez egy ismert hiba lenne ennél a modellnél, így szinte biztos, hogy itt valóban egy elöregedett alkatrész okozta a jelenséget.

Egy tipp a workaround-ra:

https://www.kernel.org/doc/Documentation/admin-guide/kernel-parameters…


reboot=		[KNL]
			Format (x86 or x86_64):
				[w[arm] | c[old] | h[ard] | s[oft] | g[pio]] \
				[[,]s[mp]#### \
				[[,]b[ios] | a[cpi] | k[bd] | t[riple] | e[fi] | p[ci]] \
				[[,]f[orce]
			Where reboot_mode is one of warm (soft) or cold (hard) or gpio,
			      reboot_type is one of bios, acpi, kbd, triple, efi, or pci,
			      reboot_force is either force or not specified,
			      reboot_cpu is s[mp]#### with #### being the processor
					to be used for rebooting.

Ha jól sejtem, a Linux alapból cold reboot-ot futtat x86-on, esetleg próbáld meg ezt a "reboot=w" kernel paraméterrel felülbírálni, hátha így nem fagy bele legalább az újraindításba (a leállítás problémáját persze nem fogja ez megoldani, de ha beválik, akkor legalább reboot-nál nem kell izgulnod). :)