Nehalem: onboard memória kontroller, integrált grafika, max. 16 szálú SMT

Címkék

Az Ars Technica egyik cikke szerint az inteles Pat Gelsinger tegnap egy sajtótalálkozón felvázolta az Intel-től a közeljövőben várható processzorok új jellemzőit. A részletekbe nem bocsátkozó tájékoztatón az Intel embere a Penryn utódjáról, a 45nm-es Nehalem magról beszélt.

A Penryn-nel ellentétben - amely egy Core 2 Duo (Merom) leszármazott - a Nehalem újdonság lesz. Ugyan a gyökerei a Core 2 Duo architektúrában erednek, de Gelsinger szerint ez lesz az első igazi dinamikusan skálázható mikroarchitektúra.

Jellemzők:

  • max. 8 mag egy die-on
  • on-die memória kontroller
  • integrált grafikus processzor
  • visszatér az SMT, "Hyper-Threading-szerű" lesz, magonként max. 2 szál, max. 16 szál

A Nehalem várhatóan 2008-ban kerül gyártásra és 45 nm-es gyártástechnológiával fog készülni.

A cikk itt.

Hozzászólások

Ugy latszik az Intel ismet rajott, hogy az AMD altal valasztott ut a nyero. Elkezdtek masolni :)

- Integralt memoriavezerlo: Athlon 64
- Kozos L3 cache, magonkent kulon L2, L1: Barcelona (iden nyar)
- Serial Interconnects: HyperTransport
- Integralt GPU: Fusion

Ha valaki egy ilyen procit akar venni akkor nem kell 2008-ig varni, az AMD-nel kaphato lesz iden nyaron :D Jo a Fusion nem, de ezeknek az integralt videokartyaknak olyan sebessege lesz mint amiket az alaplapra tesznek, eleg gyenge.

A 8 mag ugy jon ki, hogy ket 4 magos procit ragasztanak egymas melle. Mint a mostani 4 magos Intel procik.

Az AMD talán wafer szinten képzeli el a CPU GPU integrációt, ott akkor a sebességnövekedés szerintem érezhető lesz...
És milyen "protokollon" fog kijönni a képjel a prociról? És vajon dedikált GPU memóriát is integrálni fognak? Mert ha az alaplapig ki kell nyúlni ha videomemóriát akarsz elérni, akkor tényleg nem lesz sebességnövekedés.

"És milyen "protokollon" fog kijönni a képjel a prociról?"

Volt egy Intel ötlet pár éve, hogy az alaplapra kéne integrálni egy egészen minimális tudású videovezérlőt, tulajdonképpen frame buffert, valami szabványosítottat, olyasmit mint az ac97. Miután ez megvan, már csak a frame buffert kell feltölteni. Tehát buszprotokollon.

Ha ezt ötvözik az AMD megoldásával, akkor ráadásul az egyes processzoroknak dedikált memóriája lehet, DE ez a dedikált memória akár rendszermemóriaként is megjelenhet, és Vica versa.

--
- Hogyan lehet tanulni? - Jól kell tudni kérdezni. - Hogyan lehet jól kérdezni? - Ahhoz sokat kell tudni...

Szerintem eselytelen, hogy memoriat integraljanak a prociba. El se ferne :) Maximum cache-rol beszelhetunk, de hat az a mostani videokartyakban is van, csak szinte semmit nem arulnak el rola.

Ennek az egesznek a laptop-okban lesz ertelme. Kevesebbet fog fogyasztani mint az alaplapra integralt videokartya. Sebessegben nem fogja tudni felvenni a versenyt a PCIe videokartyakkal.

Engem ez emlékeztett egy Sun processzorra: UltraSparc T1 "Niagara". Annyi különbséggel, hogy itt magonként lesz lebegőpontos egység (ahogy a Niagara utódjában is van). És persze az integrált grafikus vezérlőtől is eltekintve (de ha megnézzük az UltraSparc procikat, ott is elég rendes rendszerintegrálás van: Memóriavezérlő, Ethernet, PCI, stb.)

Ebben nem vagyok 100% biztos, de szerintem a kovetkezo:

"Nehalem has its roots in the four-issue Core 2 Duo architecture."

Nem azt jelenti, hogy negyedik kiadasu, hanem, hogy negy utasitast tud egyszerre vegrehajtani, vagy negy magos. A negyedik kiadas egyebkent is fourth issue lenne. Azert varom a nalamnal jobb angolosok velemenyet a dologrol.

"Improves execution speed and efficiency, delivering more instructions per clock cycle. Each core can complete up to four full instructions simultaneously."

http://www.intel.com/products/processor/core2duo/prod_brief.pdf

Egyebkent, ez nem akkora kunszt, maximum Inteleknel. Kicsit vicces, hogy az annyiszor lassunak titulalt G4 mag pont ugyanezt tudja, idealis esetben 4 utasitas vegrehajtasat orajelenkent (3 + branch), a G5 meg otot tud (4 + branch) ugyanebben a kategoriaban. Arrol most hirtelen nem talaltam adatot, hogy az Intel-fele up-to-four az barmilyen four lehet, vagy eppen ugy csak 3 + branch mind G4-nel, de ha valaki sokat kotekedik, akkor utana nezek... :)

Es itt most nem a processzorok teljesitmenyet vitatnam meg, hiszen az sok tenyezobol all ossze, csak jeleztem, hogy ebben a formaban eleg tomeny marketing BS szaga van a fenti mondatnak. :)

-=- Mire a programozó: "Na és szerintetek ki csinálta a káoszt?" -=-

Ha valaki vegre rakna ala egy rendes buszt (nem 133MHz SD-t), akkor ma is buntetne a cucc. Nagyon sok olyan tulajdonsaga van, ami a mai "modern" x86 vonalon mostanaban kezd becsuszni. Pl a kedvenceim:
- 1 inst/cycle altivecnel (ez SSE-nel nem igy van)
- altivec valahogy elso blikkre kiforrta magat, mig SSE mar 4, revizional tart
- 32 db regiszter (iszonyu kenyelmes ennyi regiszterrel programozni, es hiaba a ezer csillio kilobajt cache, attol ennek elerese a leggyorsabb, amibol az r0 szokott spec tartalommal birni, es nem 8-bol ketto, mint x86-on)
- nem az az idiota stack based FPU van benne, mint az x87, ami jobbara csak az st(0)-lal tud muveletet vegrehajtani, hanem rendesen regiszter alapokon megy
- nincs femms/emms utasitas, ami szol a cpu-nak, hogy "te, vaze, ke'ne a FPU, ticcsad le a SIMD-et szaru'"
- az sc utasitas, aminek megfelel a sysenter utasitas x86-on, ami EXTENSION-kent jott be azon a vonalon
- jobb esetben 2 inst/cycle helyett 3+branch-ot tud kezelni G4

stb.

Csak a koritesen javitananak mar vegre egy kicsit... van ra sansz, vannak szep tervek, kivancsi leszek a vegeredmenyre.

---
pontscho / fresh!mindworkz

Akkor nem lassú a G4?:P

"Es itt most nem a processzorok teljesitmenyet vitatnam meg, hiszen az sok tenyezobol all ossze"... Egyebkent a G4-nek (es kicsit a G5-nek is), az volt a baja, hogy nem lehetett rendesen adattal etetni. A G4-ben szuk volt a busz, hiaba volt/van benne az irtozatos Altivec, ami kb. minden hasonlo probalkozast agyonver, es az ugy altalaban remek PPC FPU, ha mast sem csinalt a proci, csak arra vart h. legyen adat. Ha valamit el lehet intezni regisztereken beluli number crunchinggal, akkor egy lassan 5 eves 7447-es G4-nek a mai napig keves ellenfele akad. A G5 kicsit hasonlo eset, de ott nem a savszelesseggel, hanem a memoria latency-vel voltak sulyos problemak, integralt memoriavezerlo ide vagy oda (meg az hogy a reszben mikrokod-implementalt Altivec miatt itt mar nem volt akkora szeduletes kulonbseg a SIMD es a generic kod vegrehajtasi sebessegeben, mint G4-en)...

Remelem megerjuk azt, ahogy az IBM igeri, a kov. generacios hypertransportot fogjak hasznalni a jovobeni Power procik. Az sokat segitene ezeken a problemakon. Es meg a 8641D (a G4 ketmagos fullintegralt utodja) sem egy lefutott meccs, bar felek hogy mint mar annyiszor a szep igeretekbol vegul tul keves es tul keson valosul meg...

-=- Mire a programozó: "Na és szerintetek ki csinálta a káoszt?" -=-

Hmm nem lesz ez egy így kicsit sok egyszerre?
A Peryn 45nm-en 4 magos és ~150mm^2 a mérete.
A Nehalem 8 magos ez kapásból ~300mm^2 hacsak a cache-t nagyon durván nem fogják vissza. Márpedig ha úgy akarják, mint az AMD, vagyis magonként kis (de min 512kB) független L2 + egy nagy (min 4MB de inkább több) közös L3, mindezeknek ráadásul az asszociativitása is meg lesz emelve, akkor az azt jelenti, hogy nem nagyon tudnak a méreten csökkenteni, sőt...
Ha jól tudom még nem volt 300mm^2-es vagy annál nagyobb x86-os processzor a piacon vagyis a kihozatal nem lehet valami fényes.
És akkor még csak a magokat és a cache-t vettem figyelembe. Erre jön még az integrált északi híd, memóriavezérlő és soros busz interfész ami az AMD 4 magos processzoránál kb 25%-át teszi ki a felületnek. Már 375mm^2-nél járunk.
Az integrált grafikus processzor szerintem kb egy újabb 100mm^2 simán meglehet, vagyis ha mindezt egybe akarná az intel rakni, akkor egy majdnem 5cm^2 szörnyeteg jönne ki. 300 mm-es wafereken egészen biztosan nem lehetne ezt gazdaságosan gyártani. De ha azt vesszük, hogy ez majd kap egy méretcsökkentést 32nm-re még akkor is egy 250mm^2-es chipről van szó, ami még mindig fölötte van annak, amit költséghatékonyan előállítható.
Tehát én csak egy dolgot tudok elképzelni, hogy a fenti feature lista csak egy marketingduma, ezeket nem úgy kell érteni, hogy "mindezt egyszerre", hanem mondjuk lesznek ilyen változatok, hogy kétmagos+grafikus vezérlős, 4 magos nagy cache, 8 magos kis cache. A 32nm-re csökkentés után lehet szó 4 magos+videovezérlőről, vagy 8 magos megnövelt cache-es változatról.
---
A definite turning point has been reached.

Pat Gelsinger == "Intel Official First Line Bullshitter"

Majd hiszem ha látom... a 80 magossal egyetemben.

Kb. mint annak idején a M$ a winfs-sel...

Egyébként pedig...lehet krva sok mag ha sw ügyileg "baszhassuk"...

Multithreaded cuccokat elég nehéz programozni. Na meg a sok lock-olás stb.

Jelenleg sincsenek olyan lassú cpu-k meg stb. csak éppen programozni nem tudjuk őket rendesen.

Akit érdekel kicsit bővebben pl.:

Uresh Vahalia: Unix internals
(Jöhetne már végre a 2. rész)

Vajon meddig lehet még eladni az újabb és erősebb procikat? A felhasználók számításigénye nem nő olyan ütemben, mint a processzorok teljesítménye. Még egy low-end Core Duo proci teljesítménye is bőségesen elegendő egy átlagfelhasználónak. Ráadásul úgy tapasztalom, hogy mostanában a szoftverek is egyre jobban kihasználják a meglévő vasat: az Ubuntu minden verzióváltáskor gyorsul egy kicsit ugyanazon a gépen (jó, lehet, hogy ez nem minden operációs rendszernél van így ;) ).

Vajon meddig érdemes növelni az átlagfelhasználóknak szánt processzorok teljesítményét? Egy idő után nem lenne logikusabb inkább a fogyasztást csökkenteni, esetleg minél több dolgot integrálni (fogyasztáscsökkentés, gyártási költség csökkentés)? Bár most a videóvezérlő integrálása ebbe az irányba mutat...

Addig növelik, amíg csak lehet. Ha meg kezd túl gyors lenni a gép, akkor meg kijön egy teljesen új oprendszer, gyakorlatilag minimális újításokkal, ami főleg design-t érint. Persze úgy megírva hogy a nagyon gyorsnak tűnő gép is hirtelen döglassú lesz, de visszaváltani régebbi rendszerre meg nem jó, mert elveszti kompatibilitását, és megvonják a sec supportot.
Na, ezért kell erősebb gép mindig. Pedig egy lassan 4 éves géppel is elég jól el lehet lenni, és minden eyecandy és értelmes játék megy rajta, csak max 800x600-ban, és 19800x7856-os felbontásban, és fele annyi fps-sel (30 felett tök mindegy, hogy hány fps, mert az ember már mozgóképnek látja). Erre bizonyítékok a nyílt forrású rendszerek, ahol számít az, hogy ne csak nagyjából menjen a gép, hanem gyors is legyen. Bár ahogy kezd befolyni a pénz ebbe az ágba, a hardvertámogatottság mellé jön majd az a mellékhatás, hogy a bináris driver lassító kódokat használ, ami arra késztet, hogy új hardvert vegyél.
Szerintem egy 2GHz-es procival ellátott gépet max memóriával érdemes bővíteni, mert én nem látom egy normális célokra használt gép esetén azt a plusszt, amiért gyorsabb proci kellene.
Ha az ember meg csak játszik, akkor jobban jár, ha vesz egy szerényebb gépet, amin netezik meg egy konzolt. Olcsóbban jön ki, és nincsen az, hogy XY játék szaggat, ezért százezerért új videókártya kell, de az nem megy bele az alaplapba, akkor csere, de ha alaplapcsere, akkor processzort is kell. Akkor már az új konfigot lehúzza a kevés memória, na még abból is bele két marékkal, aztán meg csodálkozunk, hogy már kajára sincs pénz.

---------
WARNING: Linux requires you to type! After rebooted to Windows, you can safely unplug your keyboard.

Erdekes kerdes ez a 24fps dolog, bar kisse offtopic itt :)
Szoval az igaz, hogy 24-25 fps folott mar nem latja az ember az egyes kepkockakat, de a mozgas folyamatossagahoz azert nem art ha nagyobb az fps, kulonben akadozik.

A nagyobb gond az, hogy nem az az fps szamit, amivel a progi renderel, hanem amivel a megjelenito dolgozik. A moziban azert eleg a 24fps mert csak 24 kepkocka villan fel masodpercenkent, ezt latja csak az agyunk es interpolal kozte. A TV-nel 50 felkep van, igy ami mozog azt 50fps-el latjuk, ami all azt 25-el, ez volt anno a nagy talalmanyuk (mozgo kep kisebb felbontasban nagyonn fps-en, mint az allokep). Azota is szopnak vele a 100hz-s tv gyartok, mert ha ugyanazt a mozgasfazist mutatjak 2x egymas utan akkor a szem ugy latja mintha mindig menne-megallna-menne-megallna, interpolalni mozgokepet meg nem egyszeru muvelet, es csak a dragabb tv-k tudjak azok is eleg bugosan (motion compensation). Egyszer lattam egy samsung 100hz-s tv-n ahogy a si-kozvetitest mutattak es a sielovel egyutt neha egy darab mozgott a hatterbol is...
Crt-nel ugyanez a gaz, az idealis az lenne, ha a kepfrissitessel (60..85hz) megegyezo lenne az fps, es pontosan annak megfelelo mozgasfazisokat mutatna, ilyenkor latja a szem teljesen egyenletesen mozgonak a kepet. TFT-nel meg erdekesebb a helyzet, mert ott nincs kepfrissites (tehat nem felvillanak a kepek masodpercenkent Nx), hanem folyamatosan lathato a kep...

A'rpi

Szoval az igaz, hogy 24-25 fps folott mar nem latja az ember az egyes kepkockakat, de a mozgas folyamatossagahoz azert nem art ha nagyobb az fps, kulonben akadozik.

Boven nem art. Ezert nem jarok moziba, nincs CRT-m, mert 80Hz-ig latom hogy mozog/villog -> fel ora utan fejfajas szem kieges, kinlodas.

---
pontscho / fresh!mindworkz

Őőő.....

Amit gyorsul a "Base OS" azt majd szépen belassulja a GUI meg a többi divatos kinézetű ráncfelvarrott felhasználói szar...

Ha linux-on sebességet akarok lehet nem használok semmi kde v. gnome-osat.

vindóze oldalon uez a helyzet.

Most hogy a mostani hw-eken már pont élvezhető a winxp...
-Pláne ha kiherélem mondjuk nlite-tal...
(mint anno pentium1-en a win3.1 villámgyors volt már!)

...Bejött a vista a hw kereskedők legnagyobb örömére...
És máris lett egy tetűbb gépe annak aki felrakta...

(ld. pl neten a 2GB wxp és 4GB vista "memory watermark" story)

Ha értelmesen (nem minden vacakkal tele, hanem tényleg csak azt, ami kell) telepíted a KDE-t, akkor nem annyira lassú az. Ráadásul a 3.5-ös széria fényévekkel gyorsabb, mint a 3.4-es volt.
A gnome-ról nem tudok nyilatkozni, csak eleinte használtam, de mivel a KDE jobban tetszett, ezért azóta sem nyúltam hozzá.

---------
WARNING: Linux requires you to type! After rebooted to Windows, you can safely unplug your keyboard.