Sziasztok.
Debian squeeze, kernel "2.6.32-5-686 #1 SMP Sun May 6 04:01:19 UTC 2012 i686 GNU/Linux".
Egy törtenés-halmaz végeredményeképpen egy hátrányos helyzet alakult ki.
A történés halmaz elemei, nem szigorú idősorrendben:
- hálókártyacsere
- adls-modem csere
- alaplap-csere
- kábelcsere
- windows-os kontollmérés
A hátrányos helyzet abban valósul meg, hogy 1 Mbps alatt van a netsebesség, holott egy win-es kontrollmérés 15Mbps sebességet mutat.
A logban a következő látszik:
[26229.225648] irq 19: nobody cared (try booting with the "irqpoll" option)
[26229.225695] Pid: 0, comm: swapper Not tainted 2.6.32-5-686 #1
[26229.225696] Call Trace:
[26229.225700] [<c106d92d>] ? __report_bad_irq+0x24/0x69
[26229.225702] [<c106d934>] ? __report_bad_irq+0x2b/0x69
[26229.225704] [<c106da59>] ? note_interrupt+0xe7/0x13e
[26229.225706] [<c106df87>] ? handle_fasteoi_irq+0x7a/0x97
[26229.225709] [<c1004dd7>] ? handle_irq+0x17/0x1b
[26229.225711] [<c1004659>] ? do_IRQ+0x38/0x89
[26229.225713] [<c10037f0>] ? common_interrupt+0x30/0x38
[26229.225715] [<c113007b>] ? bsg_open+0x194/0x1e0
[26229.225724] [<f7c9f24b>] ? acpi_idle_enter_simple+0x117/0x151 [processor]
[26229.225727] [<c11c7581>] ? cpuidle_idle_call+0x68/0xbb
[26229.225729] [<c1002377>] ? cpu_idle+0x89/0xa2
[26229.225732] [<c13bf7fc>] ? start_kernel+0x318/0x31d
[26229.225733] handlers:
[26229.225747] [<f7ddfb87>] (rtl8139_interrupt+0x0/0x3c1 [8139too])
[26229.225771] Disabling IRQ #19
A helyzet pikantériája az, hogy kettő ilyen kártya van a gépben, és mindkettő alól kirántja a rendszer az irq-t, de nem azonos időben.
Van egy harmadik kártya, azzal semmi gond nincs.
Van egy negyedik (alaplapi) vezérlő, azzal sincs.
Egyrészt, mi lehet, ami miatt kiesik az irq a kártya alól?
Másrészt: mit lehet ez ellen tenni?
Harmadrészt: milyen információkat gyűjtsek még, hogy nagyobb eséllyel tudjatok segíteni?
- 3603 megtekintés
Hozzászólások
Ugyanolyan típusúak a kártyák ? Próbáltad őket felcserélni vagy csak egyszerre egyet belerakni és kipróbálni ?
- A hozzászóláshoz be kell jelentkezni
Asus NX1001 (problémamentes)
RTL8139 (problémás)
RTL8139 (problémás)
alaplapi (problémamentes)
A problémás kártyák tehát ugyanolyanok, az alaplapon 3 db PCI port van, ezekkel a kártyákkal meg is telt. Eredendően az előző alaplapban is ezek a kártyák voltak, és a hiba már akkor is jelentkezett.
Az arrébb pakolászást azért látom jelenleg értelmetlennek, mert 3 PCI van és 2 kártya alól rántja ki a rendszer az IRQ-t. Ha a kártya helye miatt lenne, és az arrébbpakolászás megoldaná, akkor a jelenleg 2 rossz helyen lévő kártyát csak (FELTÉTELEZÉS!!!) 1 jó helyre tudnám rakni - tehát nem lenne megoldás számomra. Ráadásul az előző alaplapban is 2-3 év után jelentkezett ez a gond - szerintem inkább szoftveres a probléma.
Mi miatt dönt úgy a kernel, hogy megvonja az IRQ-t?
- A hozzászóláshoz be kell jelentkezni
Két egyforma (bármilyen) kártya okozhat problémákat. Kérlek húzd ki az egyik "RTL8139"-t és próbáld ki úgy a rendszert.
- A hozzászóláshoz be kell jelentkezni
Az első adandó alkalommal az egyiket kicseréljük. Viszont ha így van, akkor miután az egyiknek kiesett az irq-ja, akkor a másik miért működik tovább zavartalanul egy ideig? És miért csak egy ideig?
- A hozzászóláshoz be kell jelentkezni
Csere megvolt, helyzet most:
[ 1.407583] eth0: IC Plus Corporation IP100A FAST Ethernet Adapter at 0001d100, 00:1d:60:ce:7f:0d, IRQ 17.
[ 1.408815] eth0: MII PHY found at address 0, status 0x786d advertising 01e1.
[ 1.412383] r8169 0000:07:00.0: eth1: RTL8168b/8111b at 0xf7e4c000, f4:6d:04:66:c3:ba, XID 0c900800 IRQ 32
[ 1.729130] eth2: RealTek RTL8139 at 0xd000, 00:08:a1:5f:5e:7d, IRQ 19
[ 1.729614] eth3: RealTek RTL-8029 found at 0xd180, IRQ 16, 00:00:e8:5d:b0:80.
[ 3.625824] udev[482]: renamed network interface eth3 to eth7
[ 3.626362] udev[484]: renamed network interface eth0 to eth3
[ 3.626791] udev[480]: renamed network interface eth2 to eth2-eth0
[ 3.677308] udev[480]: renamed network interface eth2-eth0 to eth0
[ 9.198759] r8169 0000:07:00.0: eth1: link down
[ 9.198766] r8169 0000:07:00.0: eth1: link down
[ 9.198903] ADDRCONF(NETDEV_UP): eth1: link is not ready
[ 9.203076] eth0: link up, 100Mbps, full-duplex, lpa 0x45E1
[ 12.886491] r8169 0000:07:00.0: eth1: link up
[ 12.886637] ADDRCONF(NETDEV_CHANGE): eth1: link becomes ready
[ 20.127420] eth0: no IPv6 routers present
[ 23.472556] eth1: no IPv6 routers present
[ 129.480412] eth7: no IPv6 routers present
ezt követően pedig:
[ 187.347393] irq 16: nobody cared (try booting with the "irqpoll" option)
[ 187.347463] Pid: 0, comm: swapper Not tainted 2.6.32-5-686 #1
[ 187.347464] Call Trace:
[ 187.347468] [<c106d91d>] ? __report_bad_irq+0x24/0x69
[ 187.347470] [<c106d924>] ? __report_bad_irq+0x2b/0x69
[ 187.347472] [<c106da49>] ? note_interrupt+0xe7/0x13e
[ 187.347474] [<c106df77>] ? handle_fasteoi_irq+0x7a/0x97
[ 187.347477] [<c1004dd7>] ? handle_irq+0x17/0x1b
[ 187.347479] [<c1004659>] ? do_IRQ+0x38/0x89
[ 187.347481] [<c10037f0>] ? common_interrupt+0x30/0x38
[ 187.347483] [<c113007b>] ? bsg_open+0x17c/0x1e0
[ 187.347490] [<f7ce20f9>] ? acpi_idle_enter_bm+0x261/0x29c [processor]
[ 187.347493] [<c11c75a1>] ? cpuidle_idle_call+0x68/0xbb
[ 187.347494] [<c1002377>] ? cpu_idle+0x89/0xa2
[ 187.347497] [<c13bf7fc>] ? start_kernel+0x318/0x31d
[ 187.347498] handlers:
[ 187.347549] [<f7df58d3>] (ei_interrupt+0x0/0x5 [8390])
[ 187.347679] Disabling IRQ #16
Szóval valamiért nem ok a dolog.
Az is sántít, hogy amikor ezen kártyákat az udevd-nél a kivett eth2-re kívánom átneveztetni, akkor rendre a boot során itt megáll, aztán félig átnevezett állapotban marad (eth3-eth2). Valami nagyon nem kerek.
- A hozzászóláshoz be kell jelentkezni
Így már a másik (bennmaradt) 8139 nem fosztódik meg az irq-jától... Ki érti ezt?!?...
- A hozzászóláshoz be kell jelentkezni
Átfogalmazom a kérdést, hátha megszaporodnak a tanácsok:
Az IRQ megvonás nem azonnali - ez gyanút kelt bennem. Inkább a driver miatt "dönt így" a kernel, vagy inkább a hw körül történik valami, amit a driver jelez?
A két kártya miatt azt mondanám, hogy nem lehet hw.
Viszont ehhez a típushoz ugye két driver is van.
Meg tudom-e tenni, hogy az egyik kártyát az egyik driver, a másik kártyát a másik driver kezelje?
- A hozzászóláshoz be kell jelentkezni
augusztusban cseréltem alaplapot 1 gépben, ott hasonló kernel log jött
és ebbe futottam bele, z68-s chipsettel előjött a hiba, de nem a z68, vagy h67 a hibás, hanem a mellette lévő ASM1083, legalábbis e szerint, és alaplap csere után megszűnt
https://lkml.org/lkml/2012/1/30/216
It looks like the ASM1083 chip is bad. It's been discussed on LKML, as seen
here:
valami asus board volt
szóval milyen alaplap?
- A hozzászóláshoz be kell jelentkezni
:S ASUS P8Z68-V :(((
Oké, köszi.
A témát jegelem, amíg kiderül, hogy a chipset a rossz, vagy a chipsetdriver. Akkor addig PCI-e kártyákra váltunk.
- A hozzászóláshoz be kell jelentkezni
No igen, azt se felejtsük el, hogy egyes újabb chipsetekben nincs PCI támogatás, így ha az alaplapon van PCI slot, akkor azt valami külső (többé-kevésbbé gagyi) vezérlő valósítja meg.
http://en.wikipedia.org/wiki/List_of_Intel_chipsets#Core_i_Series_chips…
- A hozzászóláshoz be kell jelentkezni