a legnagyobb baj a HT-nel, hogy osztozik az l1,l2 cache-n. Ha az alkalmazas teljesitmenye a cache meretenek fuggvenyeben eros letorest mutat bizonyos cache meret alatt es pont ezt a limitet lepi at az cache/2, akkor a HT lenyeges teljesitmenyromlast tud hozni.
Ha az alkalmazas egyarant hasznal a cpu reszegysegeibol sokat (lebegopontos, egesz szamitas stb, de nem cache intenziv) akkor akar jelentos teljesitmenyjavulas is elerheto. Ilyen volt pl a john-the-ripper, 13% javulas volt HT on.
Egyebkent OMP_NUM_THREADS kornyezeti valtozot tudod allitani, de a kernel nem tudja, hogy te programozol pthreaddal, vagy az openmp automatikusan.