FreeBSD gcc segfault/reset - mi okozhatja?

Fórumok

FreeBSD gcc segfault/reset - mi okozhatja?

Hozzászólások

Üdv,
A következő különös problémával szenvedek. Adott egy friss FreeBSD 5.2.1 telepítés, ports fa cvsup-pal frissítve. A fordító (gcc) rendszeresen elszáll különféle üzenetekkel, néha reseteli is a gépet illetve 'panic: bad pte' kernelpánikot okoz.
A mutt-ot próbáltam felrakni, mikor a jade fordítása közben kipukkant a gcc. Ekkor töröltem a régi kernelt (kernel.old) és sikerült a fordítás! A következő feladatba (links, illetve azon belül XFree86-libraries) már megint belehalt.

Kérdés: Ez hardver? Ha az, akkor mi? Túlmelegedés kizárva. Táp?
Ha nem az? Kernel? Csaknem pontosan ugyanez a kernel futott 1,5 hónapig korábban.

Talán ilyet már látott valaki :-\

Volt fent egy 5.3-BETA6 is, az is ezt csinálta (mutt/links/kernelfordítás gcc segfault ill. full reset), de ráfogtam, hogy bétánál előfordulhat... Ugyanezen a vinyón egy linux teszi a dolgát gond nélkül.

üdv

[quote:024676a743="LGee"]Üdv,
A következő különös problémával szenvedek. Adott egy friss FreeBSD 5.2.1 telepítés, ports fa cvsup-pal frissítve. A fordító (gcc) rendszeresen elszáll különféle üzenetekkel, néha reseteli is a gépet illetve 'panic: bad pte' kernelpánikot okoz.
A mutt-ot próbáltam felrakni, mikor a jade fordítása közben kipukkant a gcc. Ekkor töröltem a régi kernelt (kernel.old) és sikerült a fordítás! A következő feladatba (links, illetve azon belül XFree86-libraries) már megint belehalt.

Kérdés: Ez hardver? Ha az, akkor mi? Túlmelegedés kizárva. Táp?
Ha nem az? Kernel? Csaknem pontosan ugyanez a kernel futott 1,5 hónapig korábban.

Talán ilyet már látott valaki :-\

Volt fent egy 5.3-BETA6 is, az is ezt csinálta (mutt/links/kernelfordítás gcc segfault ill. full reset), de ráfogtam, hogy bétánál előfordulhat... Ugyanezen a vinyón egy linux teszi a dolgát gond nélkül.

üdv

Elso olvasasra memoria hiba. memtest86 mit mond?

trey:
Memtest86+ ment egész éjjel (kb 11 óra, 83 teszt), nincs hiba. Ennyi idő alatt csak kiderült volna. Máshol is felbukkant ez a probléma (google találatok), és ott sincs egyértelmű megoldás. Ki fogom próbálni másik tápegységgel. Érdekes, hogy a linux nem csinált még semmi műsort, bár úgy látszik, a kifinomultabb oprendszer érzékenyebb a hardverhibákra :->

drastik:
dmesg a boot során a hardverekről begyűjtött infót tartalmazza, egy reset után törlődik. Üzenetekben semmit nem találtam, ha csak segfault volt. reset/panic-kor meg ugye nincs módja üzenni :-)

A kernelbe nincs belefordítva a debug funkció... igazából én amúgy is 'csak' használni szeretném a rendszert, nem debuggolni.

üdv

Úgy látom, nem biztos, hogy hardverhiba.

Az egyik jelenségre (Fatal trap 12: page fault while in kernel mode) a fejlesztők is vadásznak:

http://www.freebsd.org/doc/en_US.ISO8859-1/books/faq/troubleshoot.html#TRAP-12-PANIC

Hogy ennek van-e köze az említett gcc segmentation fault-hoz, nem tudom.
Előbbi üzenetet (panic: bad pte. Fatal trap 12) a mutt-hoz szükséges jade, azon belül a libspgrove.so.1 fordítása során produkálta a kernel, az instruction pointer alapján a propagate_priority kernel-szimbólumban.

Itt egy kis 'történeti áttekintés':

- Hardver: ABiT BD711 alaplap, 256 MB RAM (memtest OK), Intel Celeron 1.7GHz processzor. Maxtor Fireball 3 40GB vinyó (hda1 Linux swap, hda2 UFS, hda3 ext2, hda4 ext2, hda5 ext2).
- Linux alatt nincs hiba, leszámítva kb 3-4 spontán (?) resetet a 2 év alatt. (1 év Win98, 1 év UHU-Linux)
- FreeBSD 5.2.1 +saját kernel 1,5 hónapig működött hdc-n
- Valószínűleg a SmartBootManager elrontott valamit hdc partíciós táblájában (ld. http://hup.hu/modules.php?name=Forums&file=viewtopic&t=2899&sid=304520aec5d2b38e8373c47dbddbcde4 setrootbyname failed hiba)
- Azóta tudom, hogy GRUB-bal is lehet indítani a FreeBSD-t.
- hdc használhatatlan - kiszerelve (nincs UDMA kábelem hozzá, és nem is kell most)
- FreeBSD 5.3-BETA6 telepítése hda2-re
- cvsup ports frissítés és saját kernel (IPFW miatt, lényegében azonos a korábbi kernellel)
- mc, mutt és links fordítása során különböző pontokon segfaultol a gcc (jade)
- hagytam annyiban 'ezek szerint még nagyon beta' felkiáltással, bár kicsit csodálkozva, hogy ugyan más ilyenkor mit csinál
- FreeBSD 5.2.1-RELEASE telepítése ugyanoda
- cvsup ports frissítés
- mc felmegy
- saját kernel fordítása többször is sikertelen (a make alatt kb a munka 60-70%-ánál vagy reset, vagy gcc 'internal compiler error', vagy az említett 'panic: bad pte, fatal trap 12')
- Egyetlen említésre méltó dolog, hogy közben gyakran konzolt váltottam (korábban nem).

Mindezek után ma - próbaképpen - fordítottam még 2 kernelt, eddig egy hiba sem volt. Elég misztikus. Egyre inkább a FreeBSD-re fognám a dolgot. Próbálom még kiprovokálni a hibákat, hogy rájöjjek, hol a gond. Felteszem újból az 5.3-BETA6-ot, ami kapásból pofára esett.

Ötlet, vélemény, hozzászólás?

Az egyetlen látható hibaüzenet, az archívum kedvéért:

TPTE at 0xbfc2025c IS ZERO @ VA 08097000

panic: bad pte
Fatal trap 12: page fault while in kernel mode
Kernel trap 12 with interrupts disabled

fault virtual address = 0x24
fault code = supervisor read, page not present
instruction pointer = 0x8:0xc04e247e
stack pointer = 0x10:0xcdb3fc64
frame pointer = 0x10:0xcdb3fc88
code segment = base 0x0, limit 0xfffff, type 0x1b, DPL 0, pres 1, def32 1, gran 1
processor eflags = resume, IOPL=0
current process = 22 (irq11: rl0 uhci1+)
trap number = 12

panic: page fault

[quote:73fd6384ba="LGee"]
- hagytam annyiban 'ezek szerint még nagyon beta' felkiáltással, bár kicsit csodálkozva, hogy ugyan más ilyenkor mit csinál

Hat nem tudom. A HUP jelenleg FreeBSD 5.3-beta3-at futtat. Elotte volt buildkernel, buildworld, meg ami szokott. Leforditottam nem keves szoftvert, nem volt baj vele. Most 20 napja megy, eddig nem volt hiba. Nem hinnem, hogy azert van ez, mert betaX a szoftver.

Szerintem is illogikus, hogy csak azért, mert beta, ilyesmi előfordulhasson.
Akik a neten ilyesmit jelentettek, korábbi verzióknál is tapasztalták a hibát (az előbbi üzenetre gondolok). Visszatérő motívum volt a cvsup-frissítés, mint esetleges ok, illetve egyvalaki említette, hogy a 3.2-es gcc előtt nem voltak ilyen gondjai.

De: Erre varrj gombot: ma minden működik, fordult az XFree86 4.4 is!

Az összes változás tegnaphoz képest:
- kivettem a gépet az asztalból (nah bumm, 42 helyett 39 fokos a proci)
- kivettem a memóriamodult az 1. slotból, átraktam a 2.-ba (de utána visszatettem).
- a gép felett a mennyezetről lógó 'álomhozó' szélcsengőt lecseréltem az anyámtól kapott fa papagájra (egyféle gyerekjáték, marionett-szerű, anyám Prágában vette), de természetesen nem ezért.

Egyre inkább látom, hogy a Feng Shui körül lesz a megoldás... Vagy besz@rt az alaplap.

Sajnos nem hiszem, hogy mindennapi üzem közben sok esélyem lenne a hiba megfigyelésére. Még talán a Firefox fordítása során várható valami.

üdv, és köszi a figyelmet