A kernel oops-ok követése

Kernel

Arjan van de Ven tavaly decemberben jelentette be a kerneloops.org projektet. A kerneloops.org weboldal összegyűjti egy helyre a különböző levlistákon, bugzillákban található, és a felhasználók rendszerein telepített kliens (kerneloops) által jelentett kernel oops és warning üzeneteket. Az adatokból statisztikát készít, amely megkönnyíti a kernelfejlesztők munkáját, hiszen azok pontosan láthatják, hogy a kernel melyik részén jelentkezik legtöbbször probléma és azt is, hogy mi okozza ezeket a problémákat.
Arjan szerint ezen a héten 3 670 oops és warning üzenetet jelentettek, összehasonlítva a múlt heti 3 029-cel. Várhatóan egyre több helyről érkezik majd adat, mert a kliens már nem csak a projekt weboldaláról tölthető le, hanem több Linux disztribútor is szállítja. A Fedora és a Debian az alapértelmezett telepítéskor telepíti is a klienset. Részletek a KernelTrap cikkében.

A hozzászóláshoz be kell jelentkezni
3536 megtekintés

Jó dolog ez.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Mármint az, hogy már worldwide kerneloops statisztika alapján folyik a 2.6 "fejlesztése"?

0 szavazat

A hozzászóláshoz be kell jelentkezni

Biztos én vagyok a hülye, de szerintem ha már hibátlan úgyse lehet, akkor szerintem jó az, ha olyan bugokat javítanak előbb, ami több embert érint...

"...handing C++ to the average programmer seems roughly comparable to handing a loaded .45 to a chimpanzee."
-- Ted Ts'o

0 szavazat

A hozzászóláshoz be kell jelentkezni

+1. Egyébként most eszembe jutott a "disaster control" kifejezés.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Az. Főleg, hogy kiderül, hogy az oops-ok és warningok jelentős részéért felelős dolgok:

- vmware kernel modul (zárt forrású, külső)
- proprietary firegl driver (out-of-tree)
- madwifi proprietary driver (külső)
- virtualbox out-of-tree részek
- out-of-tree nouveau driver

--
trey @ gépház

0 szavazat

A hozzászóláshoz be kell jelentkezni

# of oops:

out of tree / closed: 357 db
gplkernel / open: 643 db

Fincsi.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Tehát kiderült, hogy a jelentős részéért külső szarok felelősek, amivel a fejlesztőknek nem kell foglalkozniuk. Köszi a megerősítést.

--
trey @ gépház

0 szavazat

A hozzászóláshoz be kell jelentkezni

Csakugyan jelentős kisebbség.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Mint minden, ez is nézőpont kérdése. Azonban valaminek több mint a felét (ha jól értettem amit akartál mondani), jelentős kisebbségnek nevezni mindenképpen érdekes. ;)

--
trey @ gépház

0 szavazat

A hozzászóláshoz be kell jelentkezni

+1, azonban ugye 1000-nél a 357 nem annyira számít "több mint a felének"

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ezek szerint rosszul értettem. Mindenesetre ha a bugok ~30%-val nem kell foglalkozni, az egy nagyon jó dolog. A 30% is nézőpont kérdése. Ha holnaptól azt mondják, hogy ugyanannyi pénzért holnaptól 30%-kal többet kell dolgoznod (8 helyett 10.4 órát kell lehúznod), valószínűleg te is azt fogod mondani, hogy jelentős.

--
trey @ gépház

0 szavazat

A hozzászóláshoz be kell jelentkezni

> valószínűleg te is azt fogod mondani, hogy jelentős

Sőt nem csak fogom, de már mondtam is :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

mit mondtal? en mar nem ertem mit akarsz kinyogni. szerintem ossze-vissza beszelsz, max annyit lehet kihamozni a hozzaszolasaidbol, hogy a linux (szerinted) szar.

- Use the Source Luke ! -

0 szavazat

A hozzászóláshoz be kell jelentkezni

Bocs, ma már ellőttem az analfabéták iránti megértésadagom :(

0 szavazat

A hozzászóláshoz be kell jelentkezni

jaj, te szegeny. A linkelt reszt sem ertem, ott annyit tudtam kihamozni, hogy a linux userek hulyek. koszonjuk szepen az ujabb tartalmas hozzaszolast :).

- Use the Source Luke ! -

0 szavazat

A hozzászóláshoz be kell jelentkezni

nem minden linux juzer, csak a tobbseg

0 szavazat

A hozzászóláshoz be kell jelentkezni

koszonjuk.

- Use the Source Luke ! -

0 szavazat

A hozzászóláshoz be kell jelentkezni

Bezony, a linux userek hulyek, az amerikaiak idiotak, a magyarok meg lopnak, etc. Ilyen vilag van, na.

0 szavazat

A hozzászóláshoz be kell jelentkezni

mindenki vegyen macet!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ha megnyerik az MS pert, akkor majd azon megy a veszekedes, hogy melyik disztribucio legyen mindenhol. Persze nem magyar lesz (pedig legalabb 3 van), hanem valamelyik kulfoldi ...

0 szavazat

A hozzászóláshoz be kell jelentkezni

Mai napon eddig csak három embernek okozott problémát a parse-olása, ez annyira nem rossz.

--
trey @ gépház

0 szavazat

A hozzászóláshoz be kell jelentkezni

erdekes en ertettem elsore is

lehet h az atlag hupperrel van a baj?

nem csinalsz egy szovegertes tesztet csak h kideruljon megis mennyire okos az atlag hup olvaso, sztem erdekelne par embert

http://weho.st
never happen if you never try
MD_Update(&m,buf,j); /* purify complains */

0 szavazat

A hozzászóláshoz be kell jelentkezni

Minek csinálna ha van országos teszt is szövegértésből? Jól el is véreznek rajta a mai fiatalok (is).

0 szavazat

A hozzászóláshoz be kell jelentkezni

Azért az elvérzők fele kb csak sz*rik bele, ami az N-edik (N>10) ilyen teszt után érthető is egy kicsit. Nem tudom, hogy mi alapján osztják be, de én pl még egyet se írtam, de tényleg ismerek olyat, aki több mint 10-et. Szóval jól hangzik, de max közelíti a valóságot, néha azt sem.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Basszus, Te nem az Én másik nickem vagy? ;)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Jó dolog ez :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

"felelős" != fele ;)

debian gnu/linux @ linux-2.6.22.24-op1 | patch
info

0 szavazat

A hozzászóláshoz be kell jelentkezni

Az oops-ok kb. harmadát külső modulok okozzák, amik elvileg a stabil kernel-API alapján (izé... van itt ilyen?) készültek... A maradák 2/3-on meg lehet sportolni (az 1/3-ot meg szerintem a külső cuccok fejlesztői meg fogják nézni...)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Jaja, nincsenek pontos adataim, de szerintem ha megnezzuk hogy 1 sornyi kodra mennyi ooops jut akkor valoszinuleg nagy kulonbsegek vannak. Persze abbol kiindulva hogy nagysagrenddel tobb a "gplkernel" kod mint az "out of tree".

0 szavazat

A hozzászóláshoz be kell jelentkezni

melyik zart forraskodu vmware kernel modul okozott oops-ot?

0 szavazat

A hozzászóláshoz be kell jelentkezni

az most lenyegtelen
nem erted h zart forrasu?! ;)

closed source is evil

http://weho.st
never happen if you never try
MD_Update(&m,buf,j); /* purify complains */

0 szavazat

A hozzászóláshoz be kell jelentkezni

Simán, azért lehet+kell újrakompájlolni minden minor/patchlevel kernelupdate után :))

0 szavazat

A hozzászóláshoz be kell jelentkezni

A kiinduló feltevés rossz: nem csinálsz kernelfrissítést, mert az adott 3rd party modul, ami a vmware szolgáltatás számára kritikus, adott verziójú kernelt támogat, azzal lett tesztelve. Az ESX-ben vajon miért olyan Linux kernel van, amilyen...? Egy kernelfrissítés után meg vagy lefordul, vagy sem, vagy fog működni rendesen, vagy nem -- é sez nem biztos, hogy a külső modul hibája.

Az meg pláne ebbe az irányba mutat, hogy a 2.6.24-release esetén a vmnet-bridge nem oops-ol, a 2.6.25 esetén meg igen... Höm-höm-höm...

0 szavazat

A hozzászóláshoz be kell jelentkezni

s/zárt forrású/proprietary/;

--
trey @ gépház

0 szavazat

A hozzászóláshoz be kell jelentkezni

attol me'g nem ertem, most van hozza forras vagy nincs? ;) meg akkor mi a baj vele, hogy felkerult a listadra?

0 szavazat

A hozzászóláshoz be kell jelentkezni

"144 [external] Bug in the proprietary VMWare drivers"

"külső szarok felelősek"

--
trey @ gépház

0 szavazat

A hozzászóláshoz be kell jelentkezni

http://hup.hu/node/40769#comment-379097

"Ott lehúztam 4-5 évet, és közben rendszerprogramozói szakmát szereztem, de programozni meg utáltam, így ezt is hagytam."

Tehat nem ment a programozas ...

0 szavazat

A hozzászóláshoz be kell jelentkezni

..de ez nem akadályozza abban hogy el tudjon olvasni egy kernel oops-t. Meglepő, mi? :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

miert is szar a vmware drivere? mert a kernelt foallasban matyizok megvaltoztattak dolgokat, hogy veletlenul se menjen a korabbi verziokkal tokeletesen mukodo driver?

0 szavazat

A hozzászóláshoz be kell jelentkezni

FUD.

---
pontscho / fresh!mindworkz

0 szavazat

A hozzászóláshoz be kell jelentkezni

Már micsoda? A 2.6.24-gyel ok, a verziószám harmadik tagjában (épeszű esetben (!Linux) patchlevel) egyel frissebb _stabil_ kernellel meg elborulgat. Egyébként meg érdemes megnézni, hogy melyik kernelverzió a támogatott, aztán nyöszögni hogy sz..r a modul...

0 szavazat

A hozzászóláshoz be kell jelentkezni

0.9.4-es madwifi egy hulladék ...
még mindig 0.9.3.3-ast + átemelt parchekkel használok, mivel a 0.9.4-es instabilitást okozott olyan 1-2h használoat után + jött a panic() :)

debian gnu/linux @ linux-2.6.22.24-op1 | patch
info

0 szavazat

A hozzászóláshoz be kell jelentkezni

örülök a kezdeményezésnek, a számok csak ritkán hazudnak :)

[fun]ezentúl a kernelt -funroll-oops -szal kell forgatni[/fun]

0 szavazat

A hozzászóláshoz be kell jelentkezni

amúgy a panic-oknál lenne ezt jó megoldani, csak azt nem olyan egyszerű nyomon követni...
kell hozzá egy másik gép, amire serial portot, fw-n, usb-n vagy etherrel csatlakozik és akkor vagy etherconsolellal vagy serialon kitolni a kernel logokat..

debian gnu/linux @ linux-2.6.22.24-op1 | patch
info

0 szavazat

A hozzászóláshoz be kell jelentkezni

ugyan mar, csak egy core dump az egesz, nem tudom mi olyan nehez rajta

--
“A well placed underscore makes the difference between a s_exchange and a sex_change”
— 8048 Users Manual, Intel 1977.

0 szavazat

A hozzászóláshoz be kell jelentkezni

A Linux dumpol már, vagy valamiről lemaradtam?
"no video codec le a win32vel", de "Gentoohoz lehet meg tul fiatal vagy"

0 szavazat

A hozzászóláshoz be kell jelentkezni

igen screenre, de diskre nem, azért hozta fel ..

debian gnu/linux @ linux-2.6.22.24-op1 | patch
info

0 szavazat

A hozzászóláshoz be kell jelentkezni

az nem dump
dump-bol sokkal tobb infot meg lehet tudni, vm hasznalatot, milyen processzek futottak, dmesg-et, meg azt is, hogy ki volt bejelentkezve a gepre a dump pillanataban.
de persze linuz szerint ez hulyeseg, tessek monitort fenykepezni, mert az a hi-tech

--
“A well placed underscore makes the difference between a s_exchange and a sex_change”
— 8048 Users Manual, Intel 1977.

0 szavazat

A hozzászóláshoz be kell jelentkezni

who are you kidding, linux code is better

http://weho.st
never happen if you never try
MD_Update(&m,buf,j); /* purify complains */

0 szavazat

A hozzászóláshoz be kell jelentkezni

Általában az az érv a dump ellen, hogy egy összeomló kernellel nem szerencsés diskre írni. Ez *BSD-ben hogy van megoldva, hogy biztonságos legyen?

0 szavazat

A hozzászóláshoz be kell jelentkezni

1. Nem csak BSD, hanem linuzon kívül a legtöbb UNIX így tesz
2. Miért ne lenne biztonságos a dumpdev-re írni

0 szavazat

A hozzászóláshoz be kell jelentkezni

1: nembaj, a linux úgysem unix. :)
2: pl. h egy partícióra, egy filerendszerbe akarsz írni, és történetesen a filerendszer driver omlott össze, akkor könnyen veszíthetsz adatot.

0 szavazat

A hozzászóláshoz be kell jelentkezni

panic utan sync-kel a linux kernel? :)

--
“A well placed underscore makes the difference between a s_exchange and a sex_change”
— 8048 Users Manual, Intel 1977.

0 szavazat

A hozzászóláshoz be kell jelentkezni

De miért csinálna ilyen faszságot? Nem szeretik a népek az ilyen linux-like solutionöket :)
Ez úgy működik, hogy dumpdev-re (általában =swapdev) dumpol, és boot-nál olvassa be róla /var/crash-ba.

0 szavazat

A hozzászóláshoz be kell jelentkezni

És ha nincs swap? Kezd elterjedni, hogy a sok ram miatt nem is csinálnak (az egy dolog, hogy ki szerint hülyeség, ki szerint nem - szerintem az).
---
;-(

0 szavazat

A hozzászóláshoz be kell jelentkezni

"általában"

0 szavazat

A hozzászóláshoz be kell jelentkezni

Valamint ha nem newbie linux majer vagy, akkor eleve szamitasz ilyen lehetosegre, mivel neked - mint adminnak - is tartalmazhat relevans infot egy code dump.

---
pontscho / fresh!mindworkz

0 szavazat

A hozzászóláshoz be kell jelentkezni

ujujujuj veszlyes vizekre evezunk

itt mindenki mature unix/leenugz/win* admin

http://weho.st
never happen if you never try
MD_Update(&m,buf,j); /* purify complains */

0 szavazat

A hozzászóláshoz be kell jelentkezni

akinek annyira hiányzik a dump. az programozza le és küldje LKML-re a patchet :)
amúgy szerintem meg azért sem akarják, mert úgyis leszarnák a dumpot :)

debian gnu/linux @ linux-2.6.22.24-op1 | patch
info

0 szavazat

A hozzászóláshoz be kell jelentkezni

Az a baj, hogy nem szokott elszalni a rendszerem, nem erzem szukseget.

0 szavazat

A hozzászóláshoz be kell jelentkezni

adjal lecci egy usert

http://weho.st
never happen if you never try
MD_Update(&m,buf,j); /* purify complains */

0 szavazat

A hozzászóláshoz be kell jelentkezni

Na és azt használja is (rajtad kívül) valaki? :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

mert miert is lenne veszelyes a swap volumre-ra irni egy halozati stackben tortent null pointer dereference utan?

--
“A well placed underscore makes the difference between a s_exchange and a sex_change”
— 8048 Users Manual, Intel 1977.

0 szavazat

A hozzászóláshoz be kell jelentkezni

akkor nincs veszely, de ha a disk driverben van a hiba, akkor nincs hova irni. max ilyenkor meg a networkon attolni... mondjuk 12G ram dumpjat :)

--
A vegtelen ciklus is vegeter egyszer, csak kelloen eros hardver kell hozza!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nagyon egyszerű: ha nem képes tisztességes dumpot előállítani, akkor ne dumpoljon. HA képes, akkor miért ne tegye?

(Egyébként Windowson is meg tudták oldani, hogy STOP hiba esetén kiszenvedjen magából NTFS(!) fájlrendszerre egy 64k-s minidumpot, miért ne lennének képesek a linux kernel csákányolói erre?)

0 szavazat

A hozzászóláshoz be kell jelentkezni

azert mert linus megmondta es kesz, ne okoskodjal mar... ;)

http://weho.st
never happen if you never try
MD_Update(&m,buf,j); /* purify complains */

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nem csak 64k-s minidumpot, ha kell akkor kernel dumpot vagy akár egy teljes memória dumpot is lement, beállítás kérdése. Mondjuk az is igaz, hogy nem is mindig sikerül neki (nyilván attól függ, hogy mekkora gáz van a kernel memóriaterületével), de emiatt megborulni NTFS-t még nem láttam.

0 szavazat

A hozzászóláshoz be kell jelentkezni

A kernel oops-ok követése

Hozzászólások