Suspend linux-szal. - 6. resz

Eszrevettem, hogy a messages.log-ban ilyesmi van:


May 28 09:32:03 gilgamesh r8169: eth0: link down
May 28 09:32:03 gilgamesh dhcpcd[5106]: eth0: hardware address = 00:90:f5:4b:ae:14
May 28 09:32:03 gilgamesh dhcpcd[5106]: eth0: broadcasting for a lease
May 28 09:32:04 gilgamesh NET: Registered protocol family 10
May 28 09:32:04 gilgamesh lo: Disabled Privacy Extensions
May 28 09:32:04 gilgamesh ADDRCONF(NETDEV_UP): eth0: link is not ready
May 28 09:32:04 gilgamesh Mobile IPv6
May 28 09:32:13 gilgamesh dhcpcd[5106]: eth0: exiting
May 28 09:32:29 gilgamesh ACPI Exception (thermal-0412): AE_NOT_FOUND, Invalid active threshold [0] [20070126]
May 28 09:32:29 gilgamesh logger: ACPI group/action undefined: thermal_zone / THRM
May 28 09:33:54 gilgamesh ACPI Exception (thermal-0412): AE_NOT_FOUND, Invalid active threshold [0] [20070126]
May 28 09:33:54 gilgamesh logger: ACPI group/action undefined: thermal_zone / THRM
May 28 09:36:39 gilgamesh ACPI Exception (thermal-0412): AE_NOT_FOUND, Invalid active threshold [0] [20070126]
May 28 09:36:39 gilgamesh logger: ACPI group/action undefined: thermal_zone / THRM
...
May 28 09:41:50 gilgamesh Disabling non-boot CPUs ...

A timestampeket keretik figyelni: bizony, mar 09:36-kor elindult a suspend, de csak 09:41-kor szerepel a logban, hogy kikapcsolja a CPU-t. Ebbol arra a kovetkeztetesre jutottam, hogy valoszinuleg mivel a vinyo mar ki van kapcsolva, amikor elakad a suspend, es tan a syslogd sem fut, tehat nem is tudja kiirni az uzeneteket, ertelemszeruen egy sikertelen suspendkor tehat kesobb nem lesz hibauzenet a logban. Hmmm... Dr Watson, figyel me'g?

Eddig eltitkoltam, bar tudtam rola, hogy miutan volt egy sikeres, hosszu suspend/resume cycle, azutan a gep nemcsak nem tud megegyszer elmenni suspendbe, de kikapcsolni sem tud. Ehelyett ujraindul. Igyhat egy hosszu suspend aztan egy kis hasznalat utan megprobaltam kikapcsolni - termeszetesen ujraindult. Eztan neztem bele a messages.log-ba:

Egy rakas ilyen sor jelenik meg benne, osszevissza, hol CPU0-val, hol CPU1-gyel.


May 28 09:43:42 gilgamesh logger: ACPI group/action undefined: processor / CPU0
May 28 09:43:42 gilgamesh logger: ACPI group/action undefined: processor / CPU1

Am, ami majd a bugreport irasanal fontosabb lesz talan, az ez:


May 28 09:51:17 gilgamesh [<c0151d52>] softlockup_tick+0xb2/0x100
May 28 09:51:17 gilgamesh [<c01324b3>] update_process_times+0x33/0x80
May 28 09:51:17 gilgamesh [<c01443cb>] tick_sched_timer+0x5b/0xc0
May 28 09:51:17 gilgamesh [<c01404e3>] hrtimer_interrupt+0x143/0x1d0
May 28 09:51:17 gilgamesh [<c0118943>] smp_apic_timer_interrupt+0x53/0x90
May 28 09:51:17 gilgamesh [<c0104d00>] apic_timer_interrupt+0x28/0x30
May 28 09:51:17 gilgamesh [<c017e20f>] __link_path_walk+0x2cf/0xe30
May 28 09:51:17 gilgamesh [<c015ade7>] __alloc_pages+0x57/0x2f0
May 28 09:51:17 gilgamesh [<c017edb5>] link_path_walk+0x45/0xc0
May 28 09:51:17 gilgamesh [<c016a8f3>] free_pages_and_swap_cache+0x83/0xa0
May 28 09:51:17 gilgamesh [<c017f028>] do_path_lookup+0x88/0x1d0
May 28 09:51:17 gilgamesh [<c017dda7>] getname+0xa7/0xd0
May 28 09:51:17 gilgamesh [<c017fa3b>] __user_walk_fd+0x3b/0x60
May 28 09:51:17 gilgamesh [<c01788e2>] vfs_stat_fd+0x22/0x60
May 28 09:51:17 gilgamesh [<c016a8f3>] free_pages_and_swap_cache+0x83/0xa0
May 28 09:51:17 gilgamesh [<c01789bf>] sys_stat64+0xf/0x30
May 28 09:51:17 gilgamesh [<c011f552>] do_page_fault+0x312/0x600
May 28 09:51:17 gilgamesh [<c011f240>] do_page_fault+0x0/0x600
May 28 09:51:17 gilgamesh [<c0104232>] sysenter_past_esp+0x5f/0x85
May 28 09:51:17 gilgamesh [<c0340000>] netlbl_cipsov4_listall_cb+0x170/0x230
May 28 09:51:17 gilgamesh =======================
May 28 09:51:17 gilgamesh logger: ACPI group/action undefined: processor / CPU0
May 28 09:51:18 gilgamesh logger: ACPI group/action undefined: processor / CPU0
May 28 09:51:18 gilgamesh logger: ACPI group/action undefined: processor / CPU1
May 28 09:51:18 gilgamesh logger: ACPI group/action undefined: processor / CPU1
May 28 09:51:18 gilgamesh logger: ACPI group/action undefined: processor / CPU0
May 28 09:51:18 gilgamesh logger: ACPI group/action undefined: processor / CPU0
May 28 09:51:18 gilgamesh logger: ACPI group/action undefined: processor / CPU0
May 28 09:51:18 gilgamesh logger: ACPI group/action undefined: processor / CPU1
May 28 09:51:18 gilgamesh logger: ACPI group/action undefined: processor / CPU0
May 28 09:51:18 gilgamesh logger: ACPI group/action undefined: processor / CPU1
May 28 09:51:18 gilgamesh logger: ACPI group/action undefined: processor / CPU1
May 28 09:51:18 gilgamesh logger: ACPI group/action undefined: processor / CPU1
May 28 09:52:39 gilgamesh [<c0151d52>] softlockup_tick+0xb2/0x100
May 28 09:52:39 gilgamesh [<c01324b3>] update_process_times+0x33/0x80
May 28 09:52:39 gilgamesh [<c01443cb>] tick_sched_timer+0x5b/0xc0
May 28 09:52:39 gilgamesh [<c01404e3>] hrtimer_interrupt+0x143/0x1d0
May 28 09:52:39 gilgamesh [<c0118943>] smp_apic_timer_interrupt+0x53/0x90
May 28 09:52:39 gilgamesh [<c0104d00>] apic_timer_interrupt+0x28/0x30
May 28 09:52:39 gilgamesh =======================
May 28 09:52:40 gilgamesh shutdown[6363]: shutting down for system halt
May 28 09:52:40 gilgamesh init: Switching to runlevel: 0
May 28 09:52:41 gilgamesh logger: ACPI group/action undefined: processor / CPU0
May 28 09:52:41 gilgamesh logger: ACPI group/action undefined: processor / CPU0
May 28 09:52:41 gilgamesh logger: ACPI group/action undefined: processor / CPU1
May 28 09:52:42 gilgamesh logger: ACPI group/action undefined: processor / CPU1

Vajh mit jelenthet az a crashdump? es ami fontosabb... Mi okozza?
Tan egy modul? Interrupt-handling? Softlockup_tick... erdekes.

Nezzunk bele az errors.logba is, hamar egyszer itt vagyunk:


May 28 09:51:17 gilgamesh BUG: soft lockup detected on CPU#1!

Ahha! Megvagy! Maj. 28-an, 09:51:17-kor, amikor a fentebbi softlockup_tick-es szosszenet kezdodik, az errors.log-ban megjelenik egy a masodik magra vonatkozo hibauzenet.

Na de mara legyen ennyi eleg is. A mai vizsgam utan kiprobalok egy smb-disabled kernelt, vagy a jelenlegi kernelemmel kikapcsolni manualisan a masodik magot (/sys/devices/system/cpu/cpu1/online), meg ilyesmik. Erzitek mennyire kozel vagyok mar? :)

Hozzászólások

Elvileg ki kéne kapcsolnia a non-boot magot. Nálam, szegény egymagosnál legalábbis ez volt a logban. Észrevettem én is hogy akkor írkál logba kikapcsolási fázisra utaló dolgokat amikor visszatér a hiberből..
---
Mushroom mushroom..

melyik suspend ez ?

nekem suspend2 van, és szépen kiírja % osan hol tart a suspend
voltak változások tavaly szeptember óta :D

Celeron-M 1400Mhz, 768M, Debian SID, 2.6.22-rc2