Jó látni, hogy lelkesen benchmark-olsz :) Python3-32 vagy Python3-64? Azért érdemes timeit-et használni, mert egy mérés az nem mérés. Az utolsónál kb. az történt, hogy a numba nem tudta jit-elni. Kizárásos alapon a sum lehet neki sok...
Ezt még esetleg megmérheted:
import numpy as np
sum(np.linspace(1, 10**9, dtype=np.int64))