Az optimalizációnak is vannak fokai. Ez egy desktop képfeldolgozó engine egyik nagyon sokszor lefutó művelete. Nem mindegy, hogy 40 msec a fillezés vagy 25, ezért optimalizáltam sztenderd c++ nyelvi eszközökkel ami nem hinném, hogy indiai kódot eredményezett volna :) Viszont az mindegy, hogy 20, vagy 19 msec, ezért mélyebben nem volt szükség, hogy belemenjek. Van embedded DSP-n futó kódunk is, ott elő kellett venni a generált assembly-t, mivel rengeteg dolgot tud párhuzamosítani a cucc, ha jól sáfárkodunk a ciklusszervezésekkel. Ott abszolút érthető és indokolt volt a lépés.