( apal | 2022. 05. 17., k – 15:57 )

Igenigen, itten komplex szamok komplex egyseggekkel valo szorzasat es felosszegzeset kell megoldani, valojaban ez a megoldando problema: https://latex2png.com/pngs/3ffeb319ad07ff3c84446cd87d102b2a.png. Ahol a memoria-eleres mar eleve a kettos indexu valtozo, z^{(k)}_j miatt nem annyira egyertelmu. Ugye ezek jonnek a bemeneti bufferbol (sib->sib_buffer), es ott ugy vannak sorbarendezve hogy nnode darab, nsample hosszusagu tomb van egymas mogott, linearisan (ezt persze ki lehet valtani kettos indirekcioval, de ahogy mondod, nem biztos hogy jol jarnank ezzel). A p_k, q_k ertekek pedig a sip->sip_offset ill sip->sip_step ertekek, amik lenyegeben barmilyen egesz szamok lehetnek.

A lookup is azert kerulhetett bele mert az \exp() csak N fele erteket vehet fel, az elegge konstans (N az a sif->sif_phase_shift_length a programban). Es az \exp() periodicitasa miatt a lookup-megoldas nagyon termeszetesen adja magat, viszont az ketsegtelen hogy a q_k tetszoleges erteke miatt nagyon kell benne ugralni. 

Szoval tkp ezt a formulat barhogy at lehet rendezni hogy az jo legyen ;) 

Kicsit hasonlit az egesz a DFT/FFT  temakorre az \exp() fuggveny ill a hasaban levo komplex egyseggyok-hatvanyok miatt, de azert nem is teljesen ugyanaz. Es emiatt a hasonlosag miatt gondoltam hogy a SIMD jo lehet, merthat ugye pont ezeket szoktak iskolapeldanak hozni(?). GPU itt sajnos annyira nem jatszik. Egyreszt nem ertek hozza ennyire, es ez most konkretan egy headless, beagyazott gep, sztem olyan combos GPU nincs is benne (ha egyatalan), viszont az meg meginkabb architekturafuggove tenne a dolgot...