Megemlítenék itt egy apró ámde lényeges különbséget.
1: X QPS-re méretezzük a rendszert, X fölötti forgalmat eldobjuk, az X QPS sikeressége mindig garantált
2: X QPS-re méretezzük a rendszert, X fölött az egész rendszer szenvedni kezd, 2X-nél a sikeres kérések aránya abszolút 0-ra csökken
Avval nincs baj, ha az X nem pont akkora, mint a valós terhelés, de a júzerek egy része azért eléri a célját, a többiek később újra próbálkoznak, kisimul a terhelés, és mindenki sikerrel jár végül.
A baj akkor van, ha a túl nagy terhelés miatt semennyi júzer nem tudja elérni a célját. Mert akkor van egy teljesen használhatatlan rendszered. És ez bizony szakmai hozzá nem értés.
(És már csak zárójelben említem, hogy ez sem ördögtől való: 3: a rendszert úgy rakjuk össze, hogy automatikusan tudjon horizontálisan skálázódni, ezért 1 és 100000 QPS között bármit elvisz optimális erőforrás kihasználással, csak legyen mögötte hadrendbe állítható vas.)