Ubuntun leáll a vezetékes hálózat bekapcs után kb 1-3 órával

Fórumok

A gép:
- Ubuntu 18.04.3 LTS
- a hálókártya egy alaplapi kártya (asus p8h61-m pro)

A hibajelenség:
- bekapcs után kb 1-3(?) órával elmegy a hálózat. w10 alatt ugyanez a gép nem csinál ilyet. A hiba kb 1-2 hónapja van. Alkalmazáshoz vagy használati módhoz nem tudom kötni. Amikor ezen elmegy a háló, akkor a helyi "routert" sem tudom pingelni viszont közben minden más itthoni hálózati eszköz működik.

Ezt tettem eddig:
- A "sudo service NetworkManager restart" hatására a hálózati kapcsolat azonnal rendbejön.
- nézegettem a weben.
-- Volt olyan megoldás, ahol azt írták, hogy az update-ek után megjavult. Nekem nem
-- Volt ilyesmi https://askubuntu.com/questions/771627/14-04-network-manager-stopped-wo… de mivel ezek elég régiek, feltételeztem, hogy már nem releváns de az ott javasolt "sudo dpkg -i network-manager_*.deb" nekem "pkg: error: cannot access archive 'network-manager_*.deb': No such file or directory" üzenetet ad. FIGYELEM: lamer vagyok :-)
-- Próbáltam egy ilyet, nem jött be: https://ubuntu-mate.community/t/stop-network-disconnecting-in-ubuntu/829

Hozzászólások

Az XX helyén nyilván számok voltak. Mivel nem tudom, hogy mennyire egyedi, ezért kiikszeltem:

1: lo: mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
valid_lft forever preferred_lft forever
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: enp3s0: mtu 1500 qdisc fq_codel state UP group default qlen 1000
link/ether XX:XX:XX:XX:XX:XX brd ff:ff:ff:ff:ff:ff
inet 192.168.0.206/24 brd 192.168.0.255 scope global dynamic noprefixroute enp3s0
valid_lft 3056sec preferred_lft 3056sec
inet6 fxxx::1xx:exxx:bxxx:fxxx/64 scope link noprefixroute
valid_lft forever preferred_lft forever

Első lépésként, talán crontab -ból vagy screen -ből pingelnék, mondjuk percenként. Ebből tudhatod pontosan mikor szakad le a kommunikáció. Aztán lehet összenézni a naplóval.
Esetleg, ha van valami más eszközöd a hálón (te használhatod) akkor onnan is megpingelném és naplóznám mikor szakad le.
Ha gyors megoldást akarsz vegyél egy hálókártyát.

* Én egy indián vagyok. Minden indián hazudik.

Nekem ilyeneket driver probléma okozott, vagy fizikai hiba. Tegyél bele egy másik hálókártyát, hogy azzal is csinálja-e?

Ahogy gondolod, de nem biztos, hogy van értelme küzdeni, egy hálókártya ára van vagy 1000 ft :) Ez egyik notimban ugyan ezt csinálta a wifi kártya, ott végül jó sok óra küzdelem után találtam egy drivert ami megoldotta. Innentől kezdve minden update után újra kell fordítanom a drivert és telepíteni. A vége az lett, hogy nagyon büszke voltam magamra és vettem egy USB-s külső wifi kártyát ami mellesleg vagy 100x erősebb volt :) Ha élvezed akkor viszont hajrá :D

"Nem látod, hogy kezdő?" A hibákból lehet tanulni, ha minden pöccre megy az nem tanulságos. Tény hogy a számítástechnikában a hibakeresés rendkívül fáradtságos és időigényes feladat, az esetek elsöprő többségében nem éri meg.
(Az átlag szakember óradíj >10 eFt ebből jó sok hálókártyát, vagy akár éppen alaplapot lehet venni)

* Én egy indián vagyok. Minden indián hazudik.

Az előző verzió nekem wifin csinált ilyet, dróton nem. A mostani kiadás (nem lts-t használok) nem csinálja szerencsére.

Érdekes hiba. Probald meg ezt:

".....modprobe.d/blacklist.conf" -ba rakd bele:

install wmi /bin/false

a grub-ban legyen ez :
acpi=off

Majd restart és teszteld.

Üdv

Szijártó Zoltán
LSYH
Aki tud az alkot, aki nem tud az csak szövegel.

Pusztan a power management részre hat amit írtam. Ennel az alaplapnal (összekevert, hogy valaki berakott egy alap linket ezt felteteleztem h ez van) van egy ilyen bug. (acpi hasznalata esetén pl. a network modult lekapcsolja. Ez inkább hw probléma lehet szerintem.)
Továbbá érinti ezt a modult is WMI PNP.
A modulrol további info:
https://cateee.net/lkddb/web-lkddb/ACPI_WMI.html

Az a driver ami erre a wmi-re epul siman okozhat ilyen gondot. (feltetelzes)

Szijártó Zoltán
Aki tud az alkot, aki nem tud az csak szövegel.

Fejlemény:
beizzítottam az advanced logolást (hála egy nagyrabecsült kollegámnak, nem tudom, hogy olvassa-e :-) ).

A logolás eredménye:
A hálózat a bekapcsolás után mindig pontosan egy órával megy el és csak akkor, amikor az ubuntut úgy indítom el, hogy előtte a gépen a windows 10 volt elindítva. Ez azért számíthat, mert a windows másképp tárolja az időt (https://www.howtogeek.com/323390/how-to-fix-windows-and-linux-showing-d…) és mikor elindul az ubuntu, akkor még kb 10 másodpercig rossz időt mutat, majd befrissíti magától.

Ha tényleg az a problem, akkor a rettentő fapados megoldás az lehet, hogy mondjuk elindulás után 2 perccel restartolom a network mánágert (amikor már tuti jó az idő, bár persze ki kell próbálni, hogy segít-e).

A kevésbé fapados, hogy a https://www.howtogeek.com/323390/how-to-fix-windows-and-linux-showing-d… vagy hasonló oldalon leírtak szerint járok el. (ezt valószínűleg elkerülném, az oldalon leírt warning miatt, mivel annyira nem értek hozzá, hogy ezt felmérjem)

Advancedebb megoldást nem tudok, sajnos.

Network manager nelkul? Direkt konfigurálva at /etc/network/intefaces -ban egy eth0 kézzel?

Illetve, amikor "elmegy" a hálózat, van konzolos odaülős hozzáférésed, hogy megnézd egyáltalán
a network iface megvan-e meg? Vagy a dmesg mit mond?

Ha volt "HW" változás akkor ott megjelenik. Hátha igazolódik a gyanúm, az elötte levő hozzászólásban írtam.

Szijártó Zoltán
Aki tud az alkot, aki nem tud az csak szövegel.

"Network manager nelkul? Direkt konfigurálva at /etc/network/intefaces -ban egy eth0 kézzel?"
Ajjaj, ezt a network manager nélkul kérdést nem értem. Váltsunk át linux kezdőbe :-)

"megnézd egyáltalán a network iface megvan-e meg?"
az ip link show eredménye elegendő ehhez?

"Illetve, amikor "elmegy" a hálózat, van konzolos odaülős hozzáférésed"
van. A gép előtt ülök olyankor.

"Vagy a dmesg mit mond? "
ajjaj, most beírtam, hogy dmesg, egy kilométeres listát dobott. Melyik része érdekes?

nem tudom, hogy erre gondolsz-e de most a vége ezt mutatja (most még működik a háló).


[sze szept 25 20:32:29 2019] IPv6: ADDRCONF(NETDEV_UP): enp3s0: link is not ready
[sze szept 25 20:32:29 2019] r8169 0000:03:00.0 enp3s0: link down
[sze szept 25 20:32:29 2019] r8169 0000:03:00.0 enp3s0: link down
[sze szept 25 20:32:29 2019] IPv6: ADDRCONF(NETDEV_UP): enp3s0: link is not ready
[sze szept 25 20:32:30 2019] resource sanity check: requesting [mem 0x000c0000-0x000fffff], which spans more than PCI Bus 0000:00 [mem 0x000d0000-0x000d3fff window]
[sze szept 25 20:32:30 2019] caller os_map_kernel_space.part.7+0x10b/0x150 [nvidia] mapping multiple BARs
[sze szept 25 20:32:31 2019] r8169 0000:03:00.0 enp3s0: link up
[sze szept 25 20:32:31 2019] IPv6: ADDRCONF(NETDEV_CHANGE): enp3s0: link becomes ready
[sze szept 25 20:32:32 2019] vboxdrv: Found 4 processor cores
[sze szept 25 20:32:32 2019] vboxdrv: TSC mode is Invariant, tentative frequency 3391434373 Hz
[sze szept 25 20:32:32 2019] vboxdrv: Successfully loaded version 5.2.32_Ubuntu (interface 0x00290001)
[sze szept 25 20:32:32 2019] VBoxNetFlt: Successfully started.
[sze szept 25 20:32:32 2019] VBoxNetAdp: Successfully started.
[sze szept 25 20:32:32 2019] VBoxPciLinuxInit
[sze szept 25 20:32:33 2019] vboxpci: IOMMU not found (not registered)
[sze szept 25 20:32:36 2019] rfkill: input handler disabled
[sze szept 25 20:32:37 2019] kauditd_printk_skb: 36 callbacks suppressed
[sze szept 25 20:32:37 2019] audit: type=1400 audit(1569443557.831:48): apparmor="DENIED" operation="file_lock" profile="/usr/share/hplip/systray.py" name="/etc/xdg/Trolltech.conf" pid=1584 comm="python" requested_mask="k" denied_mask="k" fsuid=1000 ouid=0
[sze szept 25 20:32:41 2019] random: crng init done
[sze szept 25 20:32:41 2019] random: 7 urandom warning(s) missed due to ratelimiting

Kb 10 perc múlva leáll a háló, leírom majd, hogy mi lett akkor a vége.

csak érdekességképpen, ha jól látom, akkor a dmesg -T -nél az időpont relatív időpontból vannak visszaszámolva, mert ha akkor indítom el a dmesg -T -t, amikor még a rossz (windowsból maradt) idő van a linuxon, akkor a szerint írja ki, majd miután várok kb 5 másodpercet és a linux beupdate-eli az időt majd újra lefuttatom a dmesg -T -t, akkor más az új idő szerint írja ki. Ez persze lehet, hogy csak nekem újdonság :-)

falra mászok az ilyen videóktól, de megérdemlem, én írtam, hogy váltsunk át linux kezdőbe :-)

Na, most az ifconfig ezt írja ki:

enp3s0: flags=4163 mtu 1500
inet 192.168.0.206 netmask 255.255.255.0 broadcast 192.168.0.255
inet6 XXXX::XXX:XXXX:XXXX:XXXX prefixlen 64 scopeid 0x20

ether XX:XX:XX:XX:XX:XX txqueuelen 1000 (Ethernet)
RX packets 88437 bytes 111368860 (111.3 MB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 56064 bytes 4634147 (4.6 MB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0

meg egy lo-s loopback-et, feltételezem, hogy az nem érdekes. A logom szerint 16 perc múlva fog leállni a hálózat, majd leírom, hogy akkor mit ír ki az ifconfig

Hálózat, ahogy kell, leállt, a leállt állapotban futtatott ifconfig kimenete most ez lett:

enp3s0: flags=4163 mtu 1500
inet6 XXXX::XXX:XXXX:XXXX:XXXX prefixlen 64 scopeid 0x20

ether XX:XX:XX:XX:XX:XX txqueuelen 1000 (Ethernet)
RX packets 95503 bytes 117970339 (117.9 MB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 59969 bytes 5114564 (5.1 MB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0

Nem tudom, hogy számít-e de a sudo service NetworkManager restart után (amikor már újra megy a hálózat) meg ez:

enp3s0: flags=4163 mtu 1500
inet 192.168.0.206 netmask 255.255.255.0 broadcast 192.168.0.255
inet6 XXXX::XXX:XXXX:XXX:XXXX prefixlen 64 scopeid 0x20

ether XX:XX:XX:XX:XX:XX txqueuelen 1000 (Ethernet)
RX packets 96181 bytes 118319707 (118.3 MB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 60409 bytes 5200758 (5.2 MB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0

Végülis megfejtetted, a Windows időeltérése miatt a (routered) DHCP(jé)től még a Windows-ban kapott IP cím az Ubuntu alatt már lejártnak számít, és nem frissíti, mert azt hiszi, még érvényes.
Fordítva nincs ilyen baj, mert akkor később jár le, mint ahogy frissíti, tehát max. sűrűbben cserél.

Javaslat:

Vagy állíts be rögzített IP-t, vagy az alábbi cikkek alapján hozd szinkronba a két rendszer idejét

https://askubuntu.com/questions/1051018/ubuntu-18-04-wired-connection-s…
https://askubuntu.com/questions/800914/clock-shows-wrong-time-after-swi…

röviden az Ubuntuban:

timedatectl set-local-rtc 1

így a helyi időre állított gépidőt veszi fel a Linux is, ahogy a Windows...

TiLK

na, ez érdekes :-)

Sajnos nem ismerem annyira a DHCP protokollt nézegetek egy leírást a https://lazyadmin.nl/home-network/dhcp-lease-time/ oldalon, de az meg talán túl felszínes (vagy éppen, hogy már túl komplex nekem ez is... :-) ).

Az esetleg nem lenne megoldás, ha a DHCP lease time-ot felvenném nagyobb értékre? Most 1 óra van beállítva a routerben. A w10 és az ubuntu órája között 2 óra eltérés van most (GMT+2). Esetleg ha felveszem mondjuk 1 napra az nem szünteti meg ezt a problémát? A hálózatomon amúgy sincs jelentősége, mert a nincs rajta ezer változó eszköz ráadásul az a pár (telefon, tablet, laptop, tv, nyomtató ilyesmik), amúgy is többnyire reserved addresseken mennek (tehát ugyanazt osztja ki nekik a router)

A timedatectl -es megoldástól kicsit idegengedem a https://www.howtogeek.com/323390/how-to-fix-windows-and-linux-showing-d… oldalon említett warning miatt, nem szeretném, ha valami bűvös hibát okozna, amit már sokkal nehezebb lenne kinyomozni