[JEGELVE] pppoe lassu - irq veszites a halokartyan?

Fórumok

Sziasztok.

Debian squeeze, kernel "2.6.32-5-686 #1 SMP Sun May 6 04:01:19 UTC 2012 i686 GNU/Linux".

Egy törtenés-halmaz végeredményeképpen egy hátrányos helyzet alakult ki.
A történés halmaz elemei, nem szigorú idősorrendben:
- hálókártyacsere
- adls-modem csere
- alaplap-csere
- kábelcsere
- windows-os kontollmérés

A hátrányos helyzet abban valósul meg, hogy 1 Mbps alatt van a netsebesség, holott egy win-es kontrollmérés 15Mbps sebességet mutat.
A logban a következő látszik:


[26229.225648] irq 19: nobody cared (try booting with the "irqpoll" option)
[26229.225695] Pid: 0, comm: swapper Not tainted 2.6.32-5-686 #1
[26229.225696] Call Trace:
[26229.225700]  [<c106d92d>] ? __report_bad_irq+0x24/0x69
[26229.225702]  [<c106d934>] ? __report_bad_irq+0x2b/0x69
[26229.225704]  [<c106da59>] ? note_interrupt+0xe7/0x13e
[26229.225706]  [<c106df87>] ? handle_fasteoi_irq+0x7a/0x97
[26229.225709]  [<c1004dd7>] ? handle_irq+0x17/0x1b
[26229.225711]  [<c1004659>] ? do_IRQ+0x38/0x89
[26229.225713]  [<c10037f0>] ? common_interrupt+0x30/0x38
[26229.225715]  [<c113007b>] ? bsg_open+0x194/0x1e0
[26229.225724]  [<f7c9f24b>] ? acpi_idle_enter_simple+0x117/0x151 [processor]
[26229.225727]  [<c11c7581>] ? cpuidle_idle_call+0x68/0xbb
[26229.225729]  [<c1002377>] ? cpu_idle+0x89/0xa2
[26229.225732]  [<c13bf7fc>] ? start_kernel+0x318/0x31d
[26229.225733] handlers:
[26229.225747] [<f7ddfb87>] (rtl8139_interrupt+0x0/0x3c1 [8139too])
[26229.225771] Disabling IRQ #19

A helyzet pikantériája az, hogy kettő ilyen kártya van a gépben, és mindkettő alól kirántja a rendszer az irq-t, de nem azonos időben.
Van egy harmadik kártya, azzal semmi gond nincs.
Van egy negyedik (alaplapi) vezérlő, azzal sincs.

Egyrészt, mi lehet, ami miatt kiesik az irq a kártya alól?
Másrészt: mit lehet ez ellen tenni?

Harmadrészt: milyen információkat gyűjtsek még, hogy nagyobb eséllyel tudjatok segíteni?

Hozzászólások

Ugyanolyan típusúak a kártyák ? Próbáltad őket felcserélni vagy csak egyszerre egyet belerakni és kipróbálni ?

Asus NX1001 (problémamentes)
RTL8139 (problémás)
RTL8139 (problémás)
alaplapi (problémamentes)

A problémás kártyák tehát ugyanolyanok, az alaplapon 3 db PCI port van, ezekkel a kártyákkal meg is telt. Eredendően az előző alaplapban is ezek a kártyák voltak, és a hiba már akkor is jelentkezett.

Az arrébb pakolászást azért látom jelenleg értelmetlennek, mert 3 PCI van és 2 kártya alól rántja ki a rendszer az IRQ-t. Ha a kártya helye miatt lenne, és az arrébbpakolászás megoldaná, akkor a jelenleg 2 rossz helyen lévő kártyát csak (FELTÉTELEZÉS!!!) 1 jó helyre tudnám rakni - tehát nem lenne megoldás számomra. Ráadásul az előző alaplapban is 2-3 év után jelentkezett ez a gond - szerintem inkább szoftveres a probléma.

Mi miatt dönt úgy a kernel, hogy megvonja az IRQ-t?

Csere megvolt, helyzet most:


[    1.407583] eth0: IC Plus Corporation IP100A FAST Ethernet Adapter at 0001d100, 00:1d:60:ce:7f:0d, IRQ 17.
[    1.408815] eth0: MII PHY found at address 0, status 0x786d advertising 01e1.
[    1.412383] r8169 0000:07:00.0: eth1: RTL8168b/8111b at 0xf7e4c000, f4:6d:04:66:c3:ba, XID 0c900800 IRQ 32
[    1.729130] eth2: RealTek RTL8139 at 0xd000, 00:08:a1:5f:5e:7d, IRQ 19
[    1.729614] eth3: RealTek RTL-8029 found at 0xd180, IRQ 16, 00:00:e8:5d:b0:80.
[    3.625824] udev[482]: renamed network interface eth3 to eth7
[    3.626362] udev[484]: renamed network interface eth0 to eth3
[    3.626791] udev[480]: renamed network interface eth2 to eth2-eth0
[    3.677308] udev[480]: renamed network interface eth2-eth0 to eth0
[    9.198759] r8169 0000:07:00.0: eth1: link down
[    9.198766] r8169 0000:07:00.0: eth1: link down
[    9.198903] ADDRCONF(NETDEV_UP): eth1: link is not ready
[    9.203076] eth0: link up, 100Mbps, full-duplex, lpa 0x45E1
[   12.886491] r8169 0000:07:00.0: eth1: link up
[   12.886637] ADDRCONF(NETDEV_CHANGE): eth1: link becomes ready
[   20.127420] eth0: no IPv6 routers present
[   23.472556] eth1: no IPv6 routers present
[  129.480412] eth7: no IPv6 routers present

ezt követően pedig:


[  187.347393] irq 16: nobody cared (try booting with the "irqpoll" option)
[  187.347463] Pid: 0, comm: swapper Not tainted 2.6.32-5-686 #1
[  187.347464] Call Trace:
[  187.347468]  [<c106d91d>] ? __report_bad_irq+0x24/0x69
[  187.347470]  [<c106d924>] ? __report_bad_irq+0x2b/0x69
[  187.347472]  [<c106da49>] ? note_interrupt+0xe7/0x13e
[  187.347474]  [<c106df77>] ? handle_fasteoi_irq+0x7a/0x97
[  187.347477]  [<c1004dd7>] ? handle_irq+0x17/0x1b
[  187.347479]  [<c1004659>] ? do_IRQ+0x38/0x89
[  187.347481]  [<c10037f0>] ? common_interrupt+0x30/0x38
[  187.347483]  [<c113007b>] ? bsg_open+0x17c/0x1e0
[  187.347490]  [<f7ce20f9>] ? acpi_idle_enter_bm+0x261/0x29c [processor]
[  187.347493]  [<c11c75a1>] ? cpuidle_idle_call+0x68/0xbb
[  187.347494]  [<c1002377>] ? cpu_idle+0x89/0xa2
[  187.347497]  [<c13bf7fc>] ? start_kernel+0x318/0x31d
[  187.347498] handlers:
[  187.347549] [<f7df58d3>] (ei_interrupt+0x0/0x5 [8390])
[  187.347679] Disabling IRQ #16

Szóval valamiért nem ok a dolog.
Az is sántít, hogy amikor ezen kártyákat az udevd-nél a kivett eth2-re kívánom átneveztetni, akkor rendre a boot során itt megáll, aztán félig átnevezett állapotban marad (eth3-eth2). Valami nagyon nem kerek.

Átfogalmazom a kérdést, hátha megszaporodnak a tanácsok:

Az IRQ megvonás nem azonnali - ez gyanút kelt bennem. Inkább a driver miatt "dönt így" a kernel, vagy inkább a hw körül történik valami, amit a driver jelez?

A két kártya miatt azt mondanám, hogy nem lehet hw.
Viszont ehhez a típushoz ugye két driver is van.

Meg tudom-e tenni, hogy az egyik kártyát az egyik driver, a másik kártyát a másik driver kezelje?

augusztusban cseréltem alaplapot 1 gépben, ott hasonló kernel log jött
és ebbe futottam bele, z68-s chipsettel előjött a hiba, de nem a z68, vagy h67 a hibás, hanem a mellette lévő ASM1083, legalábbis e szerint, és alaplap csere után megszűnt
https://lkml.org/lkml/2012/1/30/216
It looks like the ASM1083 chip is bad. It's been discussed on LKML, as seen
here:

valami asus board volt

szóval milyen alaplap?