Clock speed helyett teljesítmény / watt

Címkék

Az Intel a jövő héten készül bejelenteni az új processzor architektúrára váltás terveit. A processzor ``jósági fokának'' mértékegysége a jövőben: teljesítmény / watt. A bejelentés valamikor a jövő héten, az Intel Developer Forum (IDF) rendezvény időtartama alatt várható.

Az Intelt korábban sokat kritizálták amiatt, hogy a processzorai teljesítményét a processzor órajelével jellemezte. Az új architektúrára váltás egyik velejárója az lesz, hogy a régi Clock speed mértékegységet elfelejthetjük.

A News.com cikke itt.

Hozzászólások

Micskó Gábor wrote:
> Az Intel a jövő héten készül bejelenteni az új processzor architektúrára
> váltás terveit. A processzor ``jósági fokának'' mértékegysége a jövőben:
> teljesítmény / watt.
Nade miben mérik a teljesítményt? :)

In article <42.9487@s.hup.hu>, Micskó Gábor wrote:
> Az Intel a jöv? héten készül bejelenteni az új processzor architektúrára
> váltás terveit. A processzor ``jósági fokának'' mértékegysége a jöv?ben:
> teljesítmény / watt.

Hat ezt mar joideje kitalaltak masok...

Milyen és mekkora terhelés alatt értendő ez az arányszám? Merthogy nem mindegy.

Az lesz vicces, amikor egy gyengébb teljesítményű, kevesebb fogyasztású procinál jobb teljesítmény/watt arány jön ki, mint egy nagyobb teljesítményű, többet fogyasztó procinál. És mivel ugye a lamma vásárló azt veszi meg, amire nagyobb számot írtak, csecsén fog pofára esni...:)

A VIA, Transmeta, es az IBM koszoni szepen ezt az ajandekot:)

kivancsi leszek az elso korrekt osszehasonlito meresi eredmenyre.

Az, hogy az AMD lesz a vegen az tuti, de ki nyeri?

tipp: IBM

Micskó Gábor wrote:
> A G4-et hasonlitani teljesitmenyben erdekes a P4-hez. Inkabb a G5-ot
> kellene, de az csak vizhutessel megy, mert olyan jol sikerult.
Vagy csak mert így sokkal csendesebb és megbízhatóbb gépet lehetett
építeni? Az árba meg belefért. :)

Milán Szabolcs wrote:
> Szerinted tehát az AMD processzorok sokat fogyasztanak és gyengék? Ezt az
> állításod mire alapozod?
Épp most nézegettük openssl speed rsa-val:

Opteron 2,6 GHz FreeBSD/AMD64 6.0:
OpenSSL 0.9.7e 25 Oct 2004 (system openssl)
sign verify sign/s verify/s
rsa 512 bits 0.0002s 0.0000s 4744.5 52892.1
rsa 1024 bits 0.0006s 0.0000s 1593.8 24855.7
rsa 2048 bits 0.0033s 0.0001s 304.8 9444.6
rsa 4096 bits 0.0200s 0.0003s 49.9 3042.5

OpenSSL 0.9.7g 11 Apr 2005 (port)
sign verify sign/s verify/s
rsa 512 bits 0.0003s 0.0000s 3977.8 45649.6
rsa 1024 bits 0.0009s 0.0001s 1142.2 19069.1
rsa 2048 bits 0.0050s 0.0002s 201.9 6488.0
rsa 4096 bits 0.0321s 0.0005s 31.2 1932.2

OpenSSL 0.9.8 05 Jul 2005 (port)
sign verify sign/s verify/s
rsa 512 bits 0.000218s 0.000017s 4592.1 58040.5
rsa 1024 bits 0.000707s 0.000038s 1414.5 26070.9
rsa 2048 bits 0.003594s 0.000103s 278.2 9743.3
rsa 4096 bits 0.021389s 0.000326s 46.8 3070.2

BTW, ugyanaz a gép 32, illetve 64 bites módban (Xeon 3,6 GHz):
uname -m
i386
sign verify sign/s verify/s
rsa 512 bits 0.0007s 0.0001s 1425.9 15478.6
rsa 1024 bits 0.0034s 0.0002s 291.7 5471.6
rsa 2048 bits 0.0207s 0.0006s 48.4 1677.0
rsa 4096 bits 0.1369s 0.0021s 7.3 474.1

uname -m
amd64
sign verify sign/s verify/s
rsa 512 bits 0.0003s 0.0000s 3311.8 39559.3
rsa 1024 bits 0.0012s 0.0001s 861.7 15464.6
rsa 2048 bits 0.0067s 0.0002s 149.6 5009.6
rsa 4096 bits 0.0435s 0.0007s 23.0 1357.6

Háát, neveznék két esetet ebbe a versenybe:

- pic16f628a mikrokontroller, kicsi is meg lassú is, de a fogyasztása!

32kHz-en eszik 24uW (mikrowatt!)-ot, 1MHz-en 240uW-ot, 20MHz-en 11.7mW-ot, a műveleti teljesítmény/fogyasztás kb. 4 MHz-nél tetőzhet, ott ehet kb. 500uW-ot.

- Üres foglalat :). Műveleti teljesítmény=0. fogyasztás=0, mérőszáma=?

Komolyra fordítva, kíváncsi lennék a régi mikroszámítógépek procijainak a mérőszámaira is, ugyanis anno még nem kellett hűteni a procikat...

Szerintem a fogyasztasi vilagbajnoksag abszolut gyoztese nem az Intel, hanem az olyannyira szeretett IBM. Az 1.9-es POWER5 pl. olyan 170Watt korul eszik, az 1.9-es Itanium2 meg 130W korul van (ennyivel azert nem jobb a POWER5). A G5-rol mar tudjuk, hogy zabalja az aramot.

A Via meg a Transmeta igaz, hogy keveset fogyaszt, de mire mesz vele ha teljesen hulladek a procik teljesitmenye a gyakorlati eletben? Ezek tobbnyire kiesnek.

Marad a Motorola G4, a Intel Dothan meg az AMD mobil cucca. Innen talan a G4 a legeffektivebb, de az uzleti siker erdekeben erdemes a Dothan-re fogadni.

Antifrogén hűtéssel szerintem el lehet vinni azt a 40KW höt egy mosogépnyi hejről. Vagy ha vizhűtéshez hasonlóan kiépítet Glukol-propiletilénes hűtést alkalmaznak -40c˚os hűtőközeget cirkuláltatva egy jégbankra vissza keringetve.

Lehet, de sztem az is benne van, hogy nagyon egyszerűek belül, nincs belső cache (mondjuk ezeken a sebességeken szükség sincs rá), stb.

Azért tájékoztató jelleggel:

Z80 (Zilog Z84C00): 20Mhz-en 0.5W

eZ80 (EZ80190): 50MHz-en 0.53W

Dragonball (Motorola 68328): 16MHz-en 50mW

És két beágyazott proci az inteltől (mondjuk nem x86 :)...)

Intel IXP1200: 233MHz-en 5.2W

Intel PXA270: 624MHz-en 0.925W

Fenet. A Latest Blue Gene/L 440-es PPC procik hajtjak, 700Mhz-n darabja. Nem tudom mennyit esznek, de keveset. 1 watt korul, max. de szerintem meg annyit se.

Osszehasonlitaskent: az en G4/1Ghy-es PPC-m eszik 9,5-10 wattot teljes terhelessel, AltiVeccel, tokkal-vonoval, de ez egy joval bonyolultabb core, mint a 440-esek...

Jo, de ebben se SIMD, se FPU, se semmi, ha mindenigaz... Bar talan FPU van benne, de nem vennek ra merget. Szoval ez a 600Mhz, nem az a 600Mhz, szerintem... :)

Egyebkent a 68060/50Mhz-s Amigamban a proci 5,5w-ot ad le, ami azt jelenti, hogy passziv hutes nelkul(!) kepes uzemelni. A teljesitmenye 80 MIPS, kb. Ugyanez a proci 66Mhz-n 6,5-7w, es 110MIPS. Bar itt mar egeszseges neki a passziv hutes, vagy a jol szellozo haz... :) 1994... :) Lehet hasonlitgatni az ertekeket a hasonlo P1-esekkel, az eredmeny meglepo es mulatsagos... :D

Jo tudom, reg volt, de azert mokas.

sorry,sorry rosszul emlekeztem:

Running at the 700 MHz clock speed expected when Blue Gene/L is delivered to Lawrence Livermore National Laboratory in the first quarter of 2005, these special chips only crank out 1.5 watts per core and the whole system-on-a-chip only dissipates 12 watts while delivering 5.6 gigaflops of floating point performance. That is very impressive, particularly since the chip is only made in IBM's 130 nanometer CMOS 8-Cu11 chip process.

nem hiszem, hogy az Intel/Amd ennek a k0zelebe bir kerulni.

forras:http://www.itjungle.com/tlb/tlb033004-story04.html

Balogh Karoly wrote:
> Jo, de ebben se SIMD, se FPU, se semmi, ha mindenigaz... Bar talan FPU van
> benne, de nem vennek ra merget. Szoval ez a 600Mhz, nem az a 600Mhz,
> szerintem... :)
Nem ismerem ezeket, de ezek nagyjából nekem is nyilvánvalók. Csak az
Intel marketinget gúnyolom megint, amely hosszú évekig a MHz-ek és
GHz-ek fontosságát sulykolta az emberekbe.
Ezekután tiszta égés volt az Itanium és most ugyancsak az a Pentium-M.

> Egyebkent a 68060/50Mhz-s Amigamban a proci 5,5w-ot ad le, ami azt jelenti,
> hogy passziv hutes nelkul(!) kepes uzemelni. A teljesitmenye 80 MIPS, kb.
> Ugyanez a proci 66Mhz-n 6,5-7w, es 110MIPS. Bar itt mar egeszseges neki a
> passziv hutes, vagy a jol szellozo haz... :) 1994... :) Lehet hasonlitgatni
> az ertekeket a hasonlo P1-esekkel, az eredmeny meglepo es mulatsagos... :D
Tudjuk, amiga.rulez.org. :)

"Ezekután tiszta égés volt az Itanium és most ugyancsak az a Pentium-M."

Szerintem nagyobb eges volt, hogy a 6-10Ghz-ig skalazni kivant NetBurstjuk meg 4Ghz alatt kifujt, es hogy annyit zabal amennyit, es cserebe olyan teljesitmenyt nyujt amilyet. Pedig azt pont a Gigaherccel-lenyomunk-mindent-re terveztek... Egyebkent az ilyenekre szoktam mondani, hogy "Es tessekmondani, egyszer majd processzort is fognak gyartani?" :)

Balogh Karoly wrote:
> Szerintem nagyobb eges volt, hogy a 6-10Ghz-ig skalazni kivant NetBurstjuk
> meg 4Ghz alatt kifujt, es hogy annyit zabal amennyit, es cserebe olyan
> teljesitmenyt nyujt amilyet. Pedig azt pont a
> Gigaherccel-lenyomunk-mindent-re terveztek... Egyebkent az ilyenekre
> szoktam mondani, hogy "Es tessekmondani, egyszer majd processzort is fognak
> gyartani?" :)
Nem ez az első hátraarc az Intelnél. AMD64, órajelháború, stb.

Jo, de ebben se SIMD, se FPU, se semmi, ha mindenigaz... Bar talan FPU van benne, de nem vennek ra merget. Szoval ez a 600Mhz, nem az a 600Mhz, szerintem... :)

Dede. FPU nincs, de helyette van rajt WMMX (SIMD), MMU, AC97 (in/out), videokartya (szep nagy felbontasokkal), flash memoria, sorosportok...

Es a 600 MHz az 600 MHz, az mas kerdes hogy neha nem nagyon erezni ;) A PXA260 400 - ig megy hivatalosan (mas kerdes hogy a 600 se kottyan meg neki) a PXA270 viszont 624. (Legalabbis PDA - ba sehol nem lattam meg ebbol a tipusbol nagyobbat.)

Olyan szivbol utalhatod te az Intelt, hogy meg a tenyekre sem figyelsz oda.

Szerintem a NetBurst el tudja erni azt a 6GHz-10GHz-et, csak nem olyan utemben, ahogy azt eredetileg vartak. A nagy hibat nem mernoki ertelemben kovette el az Intel, hanem ott, hogy nem volt B-terv, es 90nanon belefutottak olyan problemakba, amik boritottak a termektervet.

Ami miatt megis erdekes a tortenet, az az, hogy ilyen utemben meddig lesz meg felvallalhato a Netburst fejlesztese. Elobb-utobb maga az architektura avul el. Ha a 6GHz meglesz, akkor a modern CPU-k legnagyobb csodaja lesz, mert azert lenyegi valtoztatas nelkul 4-5-szoros teljesitmenynovekedest produkalt. Nem jut eszembe masik pelda erre.

Nezd be kell latni, hogy desktopon a teljesitmenynoveles legjobb modja az orajel emelese. A hagyomanyos desktop alkalmazasok futtatasakor nincs annyi parhuzamossag, ami eleg lenne egy szeles processzor kihasznalasahoz. OK. HT meg, ketmagos cucc mehet, de ezzel ki is fujt az ugy es visszaertunk az eredeti problemahoz. Tipikus Intel fikazo duma az orajel hajszolas felhanytorgatasa. Kerdem en miert nem fikaztuk az DEC-et es a Compaq-ot, amikor ok ugyanezt tettek az Alpha-val (sot az Alpha fejlesztesenek ez volt a mozgatorugoja)? Miert nem fikazzuk az IBM-et ugyanezt teszi a Power5-el es tette a PPC970-el (what a shame: kevesebb eredmennyel). Oket miert nem fikazzuk?

Minden ilyen okos ember PA-RISC-et, SPARC-ot vagy MIPS-t hasznal otthon desktopon? Pedig jo szeles hagyomanyos RISC-ek. Ja hogy tetulassuak ilyen feladatokra? Nakerem az Intel legalabb felismerte, hogy ami szerverre jo, az csunyan elhasal az asztalon.

Az Itaniumnak nem a teljesitmenye a problemas, hanem az ara. Altalaban nincs problema az Itaniummal (mostanra). Talan az egyetlen proci a piacon, ami a Power5-nek igazi ellenfele. Meg egy nagy dolgot kellene elintezniuk, hogy egy szintre erjenek: el kellene dobni a foglalatot/buszt, amibe a csucsgaz PA-RISC kompatibilitas miatt kenyszeritettek oket.

Mondjuk ez nem ujdonsag lassan a piac is raebred erre, szepen fogy az Itanium. Es jobb, ha az IBM felkoti a gatyat, szerintem komoly verseny lesz....

Miert nem fikazzuk az IBM-et ugyanezt teszi a Power5-el es tette a PPC970-el (what a shame: kevesebb eredmennyel).

Most akkor nem idezem be azt az IRC-s beszelgetest, amiben PPC-s koderekkel dumaljuk, hogy nem tetszik a G5, meg a hosszupipe, stb... :) A tobbseg egyetertett...

HT meg, ketmagos cucc mehet, de ezzel ki is fujt az ugy es visszaertunk az eredeti problemahoz.

HT a vilag legnagyobb parasztvakitasa. Kerdezd meg jopar grafikust, aki bekapcsolva hagyta a HT-t, aztan belassult a gepe, mikor parhuzamosan kellett 2 dolgot csinalnia (pl. Fotosopp + barmi mas komolyabb tevekenyseg)...

Nakerem az Intel legalabb felismerte, hogy ami szerverre jo, az csunyan elhasal az asztalon.

Az Intel gyonyoruen skalazta volna lefele az Itaniumot, es lett volna belole desktop proci, ha az AMD nem jon ki az x86-64-el...

Mondjuk ez nem ujdonsag lassan a piac is raebred erre, szepen fogy az Itanium.

Ezt meg azota mondogatjak, miota kijott az Itanium. Gondolom remelik ha sokat mondogatjak, elobb-utobb csak igaz lesz.

Amugy, a konzol nem szamit desktop felhasznalasnak? Csak mert a konzolokban is csunya gonosz szeles/alacsonyorajelu architekturaju procik futnak, 95%-ban... Es ez a trend nemigen latszik megfordulni...

Hosszu pipeline-nal nem tudsz mit kezdeni. Illetve szembehugyozhatod a vihart, de ki fog pusztulni a termeked. Kerdes az, hogy mennyire tudod ellensulyozni a negativumait? Az Intel eleg jol tudta.

Az a baj, hogy abban az esetben nem csak a proci a hibas. Nyilvanvalo, hogy a HT extra odafigyelest igenyel a programozo reszerol, a Fotosop pedig egy ratyi szoftver x86-on (talan van itt nemi osszeeskuves is, leven az Adobe erosen kotodik az Apple-hoz). Viszont korrektul megirt alkalmazasok eseten eleg sokat lehet belole profitalni. Es az Intel legalabb vette a faradsagot es beepitette a KAI labs automatikus parhuzamositast lehetove tevo eszkozeit az icc-be, elkezdte tamogatni az OpenMP-t, elkezdte arulni a tobbszalu profilert-debuggert, sot meg az MKL-be is betette a tamogatast. Szerintem korrektek voltak. A HT nem szent gral, nem automatikus a teljesitmenynovekedes, mint pl. az orajelnoveles eseten.

Csakhogy az Intel felismerte, hogy nem megy a dolog es visszavonulot fujt. Szemben pl. SGI, SUN, HP nepekkel, akik koromszakadtaig eroltetik a szerverprocikra epitett desktop gepeiket.

Tavaly-tavalyelott meg en is rohogtem az I2 eredmenyein, iden mar komolyan kell oket venni. Tenyleg bovulnek az eladasaik, lattam valahol szamokat. Mondjuk nem ujdonsag a HP ugyis atmigralja a HP-UX, Tru64 es VMS vasarloit SuperDome-ra. Raadasul amig nincs Niagara es Rock, addig a Sun-tol elpartolo nepek nagyjabol fele-fele esellyel futhatnak az IBM v. HP (Fujitsu, NEC, ....) karjaiba.

Igen csak a mai elterjedt konzolok (XBox, PS2) teljesitmenye csucsbenga. A Cell es az XBox2 meg egyenlore a nepmesek vilagaba tartozik. Terjunk vissza rajuk, akkor, amikor megjelennek (addigra mar a rendes desktop is fel fog mutatni megfelelo teljesitmenyt).

Az ok ecceru: senki nem szeretne, nagy ventillatort a konzoljaba. Ebbol a szempontbol a PC handicap-pel indul.

"Nezd be kell latni, hogy desktopon a teljesitmenynoveles legjobb modja az orajel emelese."

Legalábbis a hardvergyártók szerint :). Szerintem meg az igényes programtervezés és -implementálás lenne az. Emlékezz vissza, láttunk mi már csodákat MHz alatti gépeken is, hogy egy rattyantott amd386dx40-ből mit ki lehetett hozni, az szintén nem sámli, és ezt hagyta állva ha jól emlékszem a 68020. Most meg már a leglepukkantabb semmiségek is megabyte-okat esznek és erőmű kell hozzájuk. Miért? Mert a cégek a legkevesebb fejlesztési idő árából összecsapják a programjaikat "a sz@rt is eladjuk" alapon, aztán akik ilyeneken nőnek fel, azokból egyrészt hiányzik az igényesség, másrészt nem is igen láttak olyat (tisztelet a kivételnek). Még tizenöt év és kihalnak azok, akik még gondolkoztak azon, hogy milyen célra milyen algoritmus jó, és nem belevágták az első típust, ami a lib-ben/runtime-ban eléjük került, akik még kód-optimalizációt is csináltak, nyerve ezzel néha 10%-okat.

Hmm, eszembe jutott Sid a userfriendly.org-ról :)...

>Még tizenöt év és kihalnak azok, akik még gondolkoztak azon, hogy milyen célra milyen algoritmus jó, és nem belevágták az első típust, ami a lib-ben/runtime-ban eléjük került, akik még kód-optimalizációt is csináltak, nyerve ezzel néha 10%-okat.

üzleti szoftverben, beleértve mindent, amit határidőre, pénz motivációval "irányítanak" teljesen érdektelen az ilyen optimalizáció. _az az optimális_ ha az első (közel) helyes megoldást választja a programozó.

az opensource projektekben soxor előfordul utólagos sebesség optimalizáió. pl: most a Gnome indulás/memória foglalás csökkentése ilyen.

Egy céges szoftvernél hacsak nem felkapott marketing téma _soha_ sem kerül elő az ilyen optimalizáció (kivéve, ha a cég pénzügyi öngyikosságra készül:-)), túl sok munkaóra, és az ügyfelek nem fizetik meg plussz pénzben az elért extra eredményeket.

az ember érzékelése nem végtelen finomságu, nem vesz észre bizonyos szint alatti javulásokat/romlásokat.

Ezt az M$ maximálisan kihasználja.

ha korrekt mérések léteznének, akkor nem lepődnék meg, ha kidetülne, hogy ezen pszihologiai határ alatti romlást eredményezett minden új M$ oprendszet verzió kiadása.

kepesnek kepesek. a gond az, hogy nincs most már akkora rendelésállományuk, hogy olcsó egységárat tudjanak mondani. amikor kevés a megrendelő, kevés felé oszlik a fejlesztési költség.

Ami menti őket, az a Japán állami szuperszámítógép megrendelés.

most kaptak éppen 800mill$ egy 10000TFLOPS-os gép kifejlesztésére!!!

Japán nem kukoricázik:)

NEM. Hamár mértékegységeknél tartunk, akkor a watt az joule / szekundum, és a teljesítmény egysége. Az SI energiaegysége a joule, azaz a watt szekundum (szorzat!). A fogyasztás, amiért a villanyműveknek fizetünk, az a havi energiafelhasználás, azt az SI szerint joule-ban kellene mérnünk. Csak megszokásból inkább kilowattórában mérjük.

Az előbbiek fényében tehát a teljesítmény az időegység alatti energiafelhasználás, joule/szekundum, azaz watt.

A helyes megfogalmazás a processzorminőség mérésére ezek szerint tehát a számítási teljesítmény/felvett elektromos teljesítmény, ennek a mértékegysége pl. művelet/watt.

Gabucino wrote:
>>>Milyen kar h akiket atmigraltak azok tobbszoros sebessegcsokkenesre
>>>panaszkodnak.
>>Van err?l valami forrásod?
> Semmi authentikus :) Van egy rokonom aki PDP11-en kezdte a palyat.
Kár, pedig ezek érdekelnének, igaz csak hobbi szinten, minket egyelőre
nem veszélyeztet, hogy Itaniumot használjunk.

En lattam HPC-s (matematikai kernel) eredmenyeket, ott nem volt mar ellenfel az Alpha sem (egyszeruen elavult es lassu), PA-RISC meg soha nem is volt az. Adatbazis alkalmazasok eseten nagyon huzza az Itaniumot a ***** busz, viszont ezen a teren lesz valtozas, az Alpha meg mar nem fog gyorsulni. Ne felejtsd el, hogy az Alpha mernokgarda jo resze mar a NextGen Itaniumot reszelgeti.