Fourier Transzformáció, képFeldolgozáshoz

Fórumok

Sziasztok, szeretném megérteni
(vizsgázom belőle) a Fourier transzformációt,
de valószínűleg gyenge matematika alapom miatt ez eddig nem ment.

Láttam/néztem a wikipédia fourier-es cikkeit, illetve több képfeldolgozással foglalkozó leírást olvastam, illetve integrálással és komplex számokkal foglalkozó könyvet, hogy jobban megérthessem.

Amit felfogtam:
- hullámok előállíthatók több más hullám összegeként.
valahogy ezt az elgondolást képekre is használhatóvá tették,
tehát a digitális, 2 dimenziós képeket alkotóelemeire bontották.

Amit sejtek, de nem értek:
frekvenciatér: ha a képen húzok egy vízszintes vonalat, az ott lévő világos-sötét képpontok változásának ritmusa lesz a frekvencia?

Mit jelent a frekvenciatér?
lehet hogy nagyon vak tipp, de: a kétdimenziós képet ábrázolhatom 1 dimenzióban is, ha a sorokat egyszerűen egymás mögé írom - lesz egy hosszú vízszintes sorom, benne szürke kép esetében fényességi értékekkel - vagyis lesz egy függvényem, x-hez 0-255 közé eső szürke értékekkel - ezt közelítik meg hullámokkal ha jól értem?

Ha látok egy képet, és mellette a fourier transzformáltját, hogy bontják szét a képet alkotóelemeire - és mit is látunk tulajdonképpen a Fourier transzformált képen?

Az integrálás felfogható az adott hullám részekből való összerakásának?

A kérdések arra irányulnak hogy a Fourier transzformáció működését meg tudjam érteni.

köszönöm, dio

Hozzászólások

Mit jelent a frekvenciatér?
ilyesmik megvannak hogy vektore'r, ba'zis, skal'arszorzat, orthonorma'lt te'r? ha nincsenek, kezdd innen az ismerkedest (pl. innen, illetve ugy kb innen), ezek azert kellenek elegge a fourier-es dolgok hatterehez.

huhh, itt nagyon sok "kérdés" van, gondolom a frekvenciatér alatt nem az értetted amit az előttem szóló (amit is kellene), hanem hogy hogy lesz az 1-ből 2 dimenzió, nem sorba teszik (mint bmp-ben) hanem ha a frekvenciatérben van egy mondjuk úgy (x,y) koordinátában egy pont, akkor azt értelmezzük (r,fi)-ként, átalakítva képként ez egy hullám lesz, olyan gradienses párhuzamos csíkok, amik távolságát r adja, szögét fi, fényességét az abban a képpontban lévő egyik szám (mint az rgb képben az r), fázisát meg a másik (praktikusan ezért van ott komplex szám)

bocs a szájbarágó stílusért de nagyon messzinek tűnik szóhasználatod is:)

kezd a taylor sorral, értsd meg az 1 dimenziós fouriert, aztán nézd a képleteket hogy lesz belőle 2.. de azt nem írtad hogy alulról, analízis szinten kell vagy felülről, képfeldolgozás szinten

Őszintén szólva a Fourier transzformációt a képleténél szeretném megérteni:

- az integrál az sok kicsi rész összegzését jelenti
- a képlet belseje:
f(t) * ( cos(omega * t )-j*sin(omega*t)) dt
(szerk: dt lemaradt)
ezt szeretném megérteni, hogy ez mit jelent? miért így van a képlet?

szerk 2: és ez mit jelent a gyakorlatban, egy képpontra nézve? az adott képpont világosság értékét szorozza meg egy szög koszinuszának és szinuszának különbségével - ezt nem értem hogy ez hogy működik, miért jó ez?.

nem integrál hanem diszkrét mert a kép raszteres, de ez nem feltétlen fontos a megértéshez, annyi a különbség hogy véges tagról van szó, épp a képpontoknak megfelelő számról

nem "szinusza" hanem j*szinusza, azért ilyen a képlet mert így lesz jó nekünk :) egy függvényt felbontunk más függvények összegére, amik egyszerű szinusz függvények különböző frekvenciával, tehát egy valami bonyolultat több "kezelhető egyszerűre" bontottunk, amik hogy pontosan kiadják az eredetit kell legyen amplitúdójuk és fázisuk, előbbi adja melyik frekvencia (mennyire) szerepel benne, utóbbi felel meg annak a "j"-s tagnak (mármint nem szó szerint, lsd lentebb utsó bekezdésem)

"szerk2": a képnél kétváltozós a fourier trafó, tehát nem f(x) hanem f(x,y) és így az integrálban nem x*t hanem x*t+y*s szerepel (ahol dt és ds van az immár kettő integrálban)
így már a transzformált is két dimenziós lesz, azaz képszerűen nem szinusz hullámok hanem rácsok, és nem csak különbüző amplitudóval és fázissal hanem ugyanez a másik tengely miatt már különböző szögű rácsoknak felel meg

ahogy már írtam egy képpontban nem egy világosság érték van hanem kettő, komplex számokról van szó, csak épp eredetileg spéci komplexek voltak azok a valósak

ezt szeretném megérteni, hogy ez mit jelent? miért így van a képlet?

1 dimenzioban a fourier-trafo szemleletesen a kovetkezo"vel lehet kb egyenerteku": vegyunk 4 szamot, (a,b,c,d). az az allitas, hogy mindig es egyertelmu"en letezik 4 darab olyan (x,y,z,w) sza'm, melyekre

(a,b,c,d) = x*(1,1,1,1) + y*(1,1,-1,-1) + z*(1,-1,-1,1) + w*(1,-1,1,-1)

Lathato, hogy amennyiben a jel (gyk az abcd sorozat) az konstans akkor x nem lesz nulla, a tobbi pedig egzaktul nulla lesz. ha a jel "nagyon" hullamzik, nagy frekvenciakon, akkor a w tag lesz relative nagy, ha meg csak ugy "kozepes frekvenciakon", akkor az y meg z lesz dominans. ha a jeled atlagosan 0, akkor az x az nulla lesz.

a fourier-trafo kb pont ugyanezt csinalja, csak nem +/- 1-ekbol teszi ossze ezt a "bazisvektor-rendszert", hanem megfelelo" frekvenciaju szinusz-koszinuszokbol. de ott is a lenyeg ugyanez: ha veszel egy i=0,1,2,3 indexet, es definialod a 4 darab F_i vektort ugy hogy az F_i k-adik eleme az cos(2*pi*i*k/4)+I*sin(2*pi*i*k/4) legyen, ahol I^2=-1, a komplex egyseggyok (igen, ehhez kell sajnos egy kis komplex-sza'm-tan is), akkor az F_i vektorok pontosan ugyanazt fogjak tudni mint a fenti x,y,z,w tagok, tehat letezik olyan k0,k1,k2,k3 konstans, amivel az (a,b,c,d) felirhato, ugy mint:

(a,b,c,d) = k0*F_0 + k1*F_1 + k2*F_2 es k3*F_3.

a dolog szepsege amiert az egeszet szeretjuk hogy ez a trafo odavissza mukodik, akkor ha egy F'_i-t ugy definialsz, hogy a szinuszos re'szt nem hozzaadod, hanem kivonod. es az egeszet leosztod 4-gyel (azaz eaz elemek szamaval). tehat, F'_ik az F_ik komplex konjugaltja, azaz:

4*(k0,k1,k2,k3) = a*F'_0+b*F'_1+c*F'_2+d*F'_3.

ha ez megvan akkor johet a ket dimenzio ;)

A.

Egy képen két dimenzióban is el lehet végezni a Fourier transzformációt.
Míg egy hullám felbontható különböző amplitúdójú és frekvenciájú, egyszerű hullámok összegére; addig két dimenzióban ezt úgy próbáld elképzelni, hogy egy szabadon választott kép felbontható különböző irányú és vastagságú sávok összegére. A frekvencia térben egy pont elhelyezkedése azt mutatja meg, hogy milyen az iránya és mekkora a frekvenciája a sávoknak, az értéke pedig az amplitúdót, azaz a vastagságot jelenti.
Ha odapöttyintessz egyet a frekvencia térbe, az a képen adott vastagságú és irányú sávokat fog létrehozni.

Üdv:
Dw.

"Jegyezze fel a vádhoz - utasította Metcalf őrnagy a tizedest, aki tudott gyorsírni. - Tiszteletlenül beszélt a feljebbvalójával, amikor nem pofázott közbe."

"Amit felfogtam:
- hullámok előállíthatók több más hullám összegeként.
valahogy ezt az elgondolást képekre is használhatóvá tették,
tehát a digitális, 2 dimenziós képeket alkotóelemeire bontották."

Ennel azert tobbrol van szo, es talan ra tudok vilagitani egy-ket alapveto dologra, ami kell a fourier hasznossaganak a megertesehez.

A Fourier transzformacio olyan a fuggvenyek tereben, mint amilyen a koordinatatranszformacio 3 dimenzioban.
Ugyanugy, ahogy egy pontot a 3 dimenzioban le tudsz irni mas origoval es tengelyekkel, ezt a fuggvenyekkel is megteheted.
Egy fuggveny sok tekintetben hasonlo egy vegtelen dimenzios terben levo ponthoz. Ha elkepzelsz egy n dimenzios pontot, akkor a ra mutato vektor egy n tagu objektum. A fuggveny meg nem mas, mint egy vegtelen tagu objektum. De ahogyan egy n dimenzios vektort is el lehet forgatni, fel lehet irni mas tengelyekre vett vetuleteit, ugyanugy a vegtelen dimenzios terben a Fourier is csak egy masik koordinata-rendszer. (Van veges dimenzios, diszkret Fourier is).

Ezt uj koordinata rendszert hivjak Fourier vagy frekvencia ternek, ahogy te is irod.
Ha veszel egy tetszoleges fuggvenyt, akarhany valtozos fuggvenyt, akkor az felirhato szinuszok es koszinuszok osszegekent. A szinuszok/koszinuszok egyutthatoi pedig olyanok mint a tengelyekre vett vetuletek. Hasonloan is kell kepezni, mint a vektoroknal a transzformaciot. Kiszamolod a fuggveny vetuletet egy adott tengelyre egy skalarszorzassal : int f * sin dx peldaul. Annyi a kulonbseg, hogy szumma helyett integral van.

Ami kulonlegesse teszi a Fourier koordinatakat, az az, hogy a transzformacio gyakorlatilag ugyanaz, mint a visszatranszformacio. Altalaban ez nem igaz egy koordina/fuggveny-tatranszformaciora.

A ket dimenzios kepet lehet abrazolni egy dimenzioban, de nem erdemes, sok jelentest elveszit. Vannak ketdimenzios hullamok, azokra kell felbontani. Ilyen peldaul a sin(x)*sin(y), amely egy ketvaltozos fuggveny. A transzformaciot ekkor ket valtozon egyszerre kell elvegezni, ketvaltozos integralasokkal. Igy bontjak szet alkotoelemeire, hogy a te szavaiddal is leirjam.

Egy feher alapon huzott fekete vonal Fourier kepet nem egyszeru megerteni, de egy sima vizszintes vonal meg konnyu, mert konnyen le lehet irni kef fuggetlen vetuletet. Az egyik vetuletben csak egy csucsot latsz, az egesz vonal odaesik, ennek a delta-fuggvenynek a fourier transzformaltja konstans, mert az ilyen csucsok minden frekvenciat tartalmaznak (pont mint egyetlen koppantas). A fentiek miatt pedig a masik vetulet, egy konstas fuggveny Fourier transzformaltja pedig egy delta fuggveny megint.

Biztos nem valaszoltam mindenre, de talan ebbol a perspektivabol latva konnyebb a megertes.

szerk: latom apal is hasonlot irt :)

Mikor vizsgázol belőle? Mert ha az adott matematikai alapokkal hétfőnél előbb, akkor inkább vegyél egy karton sört és szopogasd el szépen. :) Ha hétfő vagy azután, akkor ugorj neki egy linalgebra könyvnek, aztán ortogonális függvénysorok, FT, majd DFT. De még így is nagyon-nagyon necces...

Ne értsd félre, nem poénkodni akarok rajtad, de szerintem a Fourier-dolgokat nem egyik napról a másikra szokták megérteni. Ha van valami előadó által produkált jegyzeted, akkor inkább hagyatkozz arra, vegyél hozzá egy nagy levegőt és bízz benne, hogy valahogyan sikerül. Ennél jobb tanácsot nem tudok adni...

> Fourier Transzformáció, képeldolgozáshoz

_EL_dolgozáshoz? Ahhoz nem kell FT, elég egy

 1 1 1
 1 1 1
 1 1 1

kernel, 9-es osztóval, és már el is dolgoztad. Vagy eldolgozás alatt nem a smoothingot értetted? :)

Szorri az Offért.

Innen valami a térfrekveciáról?

... és utána megnéztem tomasa hivatkozását is :)
Az Einstein-es kép ez ügyben több évtizedes standard példa :)

(
Ahhoz képest hogy 20 éve (működő) "csúszó ablakos" realtime spektrum analizátor Z80-as programot írtam,
magamnak is nehezen magyaráznám meg. Pedig az volt a lényeg, hogy nem az egész 256 elemű mintával kellett számolni, hanem csak az új bejövő és a legrégebbi kieső minta cuccait kellett hozzáadni/kivonni a tárolt spektrumból.
Az ősrégi "Modern algoritmusok" könyvemen látszik a két hely ahol valamikor ki szokott nyílni: 1. FFT; 2. prekondícionált mátrixok.
)

<az fft-transformer-nek különben sem volt valami jó élete, legalábbis aznap nem />