Mi lesz veled Itanium?

Címkék

A C|Net-en jelent meg egy hosszabb cikk, amelynek a címe: ``Itanium: A cautionary tale''.

Az érdekes cikk az Itanium processzorok történetét foglalja össze azoktól az időktől, hogy a HP fejében megszületett az ötlet, hogy egy új, mindent vivő processzort kell előállítani, egészen napjainkig.





A cikkben szó esik:

- kinek a fejében született meg az Itanium ötlet (HP, 1988)

- kivel spanoskodott össze a HP a fejlesztések érdekében (Intel, 1993)

- a processzorok (Itanium 1, 2) eddigi fejlesztésének idejéről (~ 11 év)

- a horribilis költségéről (milliárd dollárok)

- a várakozásokról, hogy milyen lesz a következő generációs processzor architektúra

- a kezdeti kudarcokról (késik a Merced, majd később megjelenik, de hulladék)

- hogyan folyt a fejlesztés (McKinley, Madison)

- mi lehet a jövő (dual-core Montecito)

- arról, hogy azt gondolják, hogy az Itanium lesz az elkövetkező 20 év processzora, és a RISC-architektúra ki fog fulladni (az állás a Gartner szerint itt)

- hogy milyen szerepet játszik, játszhat az AMD a témában

- kik azok akik kitartanak az Itanium mellett (HP, SGI és néhány kisebb játékos: NEC, Unisys, Fujitsu, Groupe Bull, Hitachi, ...)

- és kik azok akik velük voltak, de közben elfordultak (IBM, Sun, Microsoft, Dell)

- kik azok, akik szerint van jövője az Itaniumnak

- es kik azok, akik szerint nincs (Sun, Schwartz)

A jó kis összefoglaló itt.

Hozzászólások

Nezd at a szamokat, nem csak ott hanem azota is. A storage amit rakotsz szinten varialhato, es lehet feljebbb tolni a savszelesseget, gyakorlatbol tudom. Irix nem fut ezen az architecturan, az meg mindig tamogatja a MIPS R16k szeriat, es ez a kornyezet kicsit mas arkategoria lenne :)

"... SGI demonstrated near-linear scalability from two to 64 processors and achieved over 120GB per second. "

Ez a reszeredmeny architecturabol adodik, es nem csak ebben a kombinacioban mukodik.

lloyddzilla wrote:
> Nezd at a szamokat, nem csak ott hanem azota is. A storage amit rakotsz
> szinten varialhato, es lehet feljebbb tolni a savszelesseget, gyakorlatbol
> tudom. Irix nem fut ezen az architecturan, az meg mindig tamogatja a MIPS
> R16k szeriat, es ez a kornyezet kicsit mas arkategoria lenne :)
Túl sok részletet én ott nem találtam, ezért kérdeztem, hogy ez vajon
hardveres limit lehet-e.

> "... SGI demonstrated near-linear scalability from two to 64 processors
> and achieved over 120GB per second. "
... memóriasávszélességet, ami azért más, mint az IO.

Once AMD showed Intel what to do with x86--adding 64-bit support--that was the end of Itanium right there.

Na kb. ennyi. :)

Lehet hogy a Numa tech nem a legjobb, de mondj jobb rendszert a Crossbar I/O technologiakra. Szerintem mindent megesz az hogy tobb terra ramot hasznalhatsz egysegesen es nagy savszellel, petabyte-okat kothetsz storage-kent es a szamitas kapacitasrol ne is beszeljunk. Szerintem a Numa tech eleg fejlett ahhoz hogy ne legeyn versenytarsa. Az sSgi nem a csod fele tart hanem mindig is "rosszul" allt a tozsden. Erdekes modon nem helyezte ki a gyartast a tavolkeletre csupan 2 gyarat uzemeltet. az OpenGL hardware-s technologiajanak felet se adta ki a grafikus kartyakat gyarto cegeknek...

Hat ya, eleve az AMD 64-bites chipjeiben ***** a mem-ctrl .

Valamint az sgi bebizonyitotta hogy lehet itanium2-bol ugy 1024 vagy tobb cpu-s rendszert csinalni hogy egyetlen linuxkernel vezerli az egeszet. (tehat 1 gep) . Namost ilyet amd-vel meg 100 evig nem lehet mert mas iranyba indultak.

Na és azért kellett kinyírni az alpha architektúrát, merthogy útban volt ehhez a csodás kudarcba fulladt izének...

Yaya, vannak infok sgi-com-on, a lenyeg azert az hogy azzal nem arulok el nagy titkot (Linux Journal lehozta) hogy tulajdonkeppen az alaplapok (CPU, XIO, stb... rack-ek egyenesen osze vannak drotozva, igy a savszelesseget emelheted siman ameddig akarod, alapjaban a teljes rendszeren ervenyes a 6.4 G/sec. A kernel SGI Pro-pack segitsegevel kezeli az architecturat. A single system image azert jo, mert magasabb savszelesseget kapsz mint a hagyomanyos clusterken. Ott elveszited a node-ok kozti kommunikacio soran a teljesitmeny minimum 30%-at. Igy az 1000 cpus rendszer nem kb 700 gep erejet adhatja. Lehet trukkozni, de az alaplapokrol kierve mar mas savszelesseged van akar mit csinalsz. A masik az hogy a rendszer particionalasa mindig ottvan mint lehetoseg, ezaltal siman dolgozhatnak rjata fizikailag is tobben. Az NEC is kb 64 cpu/node-ot hasznal a SX szeriaban, de az azok kozotti kommunikacio es 12G/s. A hagyomanyos clusterekre es gridekre nem lehet kozvetlen vizualizacios rendszert csatlakoztatni, mert nincs meg globalis adatkozles savszelessege. Renderelni, CFD-binary -t alkotni lehet vele, de nincs interakcios lehetoseged.

Kulon:

Memoria

Altixoknal fizikailag oda teszed ahova akarod, akar kulon epuletbe osszesited a tobb terra ramot, de a rendszer egysegesnek egesznek fogja latni. NEC SX szerianal nem valaszthato kulon a node-okbol, nem kulonitheto el, de ott az Super-Unix egyesiti ismetelten, csak ugye mas a helyzet ott ahol nincs cpu cache....

lloyddzilla wrote:
> Valamint az sgi bebizonyitotta hogy lehet itanium2-bol ugy 1024 vagy tobb
> cpu-s rendszert csinalni hogy egyetlen linuxkernel vezerli az egeszet.
> (tehat 1 gep) . Namost ilyet amd-vel meg 100 evig nem lehet mert mas
> iranyba indultak.
Te milyen műszaki akadályát látod ennek? Mert az, hogy senki sem csinál
ugye még nem jelenti azt, hogy nem is lehet.

lloyddzilla wrote:
> A memoria controller a prociban van. Lehet hogy lesz ilyen de akkor mar
> kene lennie. Szerintem amd-re nem erdemes epiteni
?
A következő generációs Itaniumban is beépített memóriavezérlő van.
Következő ok?

> csak ha mar profi modon csinal alaplapokat, es komlett rendszereket nagy
> megbizhatosaggal. De azt se tudni lesz-e ilyen.
Nézzük csak. Az Intel is gyárt alaplapokat, a piaci részesedése gondolom
valahol a 0 és a kerekítési hiba között lehet velük.

Komplett rendszereket az Intel nem gyárt, legfeljebb részegységeket.
Akkor mi is van?

lloyddzilla wrote:
> Az Intel gyart teljes rendszert is, mint szerver platormokat. A masik
> kerdes ugye, hogy az integralt mem ctrl opcionalis-e.
Tudok kész Intel szervert venni az Inteltől? Ez új nekem, igaz már rég
volt, amikor utoljára néztem őket.

Vagy te arra gondolsz, hogy az Intelnek van processzora, chipkészlete és
ebből csinál alaplapot is? Ezt érted teljes rendszer alatt és az a gond,
hogy az AMD-nek ugyanezek megvannak, csak éppen alaplapot nem gyárt?

lloyddzilla wrote:
> Nem hinnem mert a mostani altixok es stb mar regen labkompatibilisek az
> itanium3-al. Az AMD problemaja nem egyenlo azon kepzelgesekkel
> amelyekkel az Itanium kovetkezo generaciojat illetik.
Ez teljesen új infó.

Két kérdés jut eszembe:
- az Intel új Itaniumjai lábkompatibilisek a mostani Itaniumokkal. Ez
milyen megkötésekkel jár?
- miért van az, hogy a Xeonnál még csak generációváltás sem volt, csak
bejött egy plusz mag a tokba és már ehhez is új megoldás kellett?

Azt lekotnem hogy ez nem Inteles informacio. (marmint a labkompatibilitas) A megkoteseket nem tudom de ugygondolom hogy az external voltage regulator szerepe nem veletlen :)

Xeonokbol csak azt tudom amit hasznalok. A Xeonokbol tobb 10 000 van kint a piacon amik eleg jo teljesitmenyt adnak le, nem csak az SMP a plusz, amin javitottak. Gondolom piaci erdek lehet hogy lassabb a generacio aramlas, hiszen a support muszaly meglegyen, mert csak az en szakmamban egy-egy ceg migracioja 2000+ cpu-rol masik architectura iranyaba (ha a storage-et nem nezzuk) sok sok szerzodes bontasba, (adott esetben berleti szerzodes felbontasaba altalaban min. 3 ev ) valamint evekbe es szakember garda fejlesztesbe kerulhet , nem beszelve a milliokrol dollarban. Talan ezert egyes agakon a stabilitas mindennel elorevalobb.

Szerintem nem kulonosebben elonyos a NUMA HPC-ben, leven a kulcsfontossagu algoritmusoknak mar nagyon hatekony MPI megvalositasai vannak.

Egy idoben nagyon sok penz aramlott a NUMA gepek feljesztesere, mert az volt a mondas, hogy nem csak a HPC-ben lehet majd vele szakitani. Aztan ez valahogy elmaradt, az SGI meg szepen menetel a csod fele.

A memorialokalitas tudtommal ad-hoc van kezelve. A forditoprogram nem tartalmaz erre vonatkozo boviteseket (holott lehetne). Valszeg a c library/kernel szintjen kezelodik a dolog.

Oszinten szolva nem adok tul sok eselyt ennek a vonalnak. Az IBM demonstralta, hogy van egy kellemesebb modja is a teljesitmeny novelesenek. Jelen esetben nem egy jolly-joker monstre CPU-t terveztek, hanem egy erre a celra specializaltat (Power 440). Ugy nez ki lenyegesen tobb teljesitmenyt kepesek osszehozni vele.

AMD a király. :) Az intel csak egy letünt kor muzeális szeleme.

lloyddzilla wrote:
> pl columbia hpc a nasanal, ott mondjuk tobb cpu-t nyomtak 1 kernel ala.
512?

Találtam egy ilyet:
http://www.linuxjournal.com/article/6440

Azért elég szánalmas eredmény egy 28 processzoros Itaniumtól 120
diszkről 1 GB/s-et olvasni (ráadásul fájlrendszer és mindenféle egyéb
overhead nélkül).

Ez vajon a Linux hibája és Irixszel normálisabb eredmény jönne ki, vagy
hardver korlát az adott konfigurációban?

Szerintem a cray elegge visszacsuszott a harom cluster csaladdal amit arul. Tulajdonkeppen nem is csodalom, gondolom az utobbi szerzodesbontasuknal az ex tulaj megtartotta a technologia nagy reszet amit belevitt. Remelem a cray meg egy szer felviragzik, de most ugylatom szinte Xeon DP szintu clusterekkel kombinal... Az elozo tulaj meghat ugye szepen megy felfele, es termekei sem keves teruletet fognak at (including vector computing)