Világelső szuperszámítógépes technológia a Fujitsutól (x)

Címkék

Több éves kutató- és fejlesztőmunkát rejt a világ szuperszámítógépeinek TOP500-as listáját vezető Fugaku szuperszámítógép, illetve az abban található Fujitsu A64FX processzor. A chip már önmagában is egy technológiai csemege, az ugyanis némileg rendhagyó módon az ARM utasításarchitektúrájára épül. Utóbbi, valamint a Fujitsu mérnöki csapatának munkája egy kimagasló hatékonyságú szerverprocesszort eredményezett, melyre a PRIMEHPC termékcsaládnak hála bárki építhet HPC-s infrastruktúrát.

A Fujitsu azon kevés gyártók egyike, amely évtizedek óta rendíthetetlenül kitart a házon belül tervezett processzor koncepciója mellett. A SPARC64 családot nem kell bemutatni a kiszolgálók világában otthonosan mozgó szakembereknek. Ez utóbbival megszerzett több évtizedes tapasztalatra, valamint az elmúlt években meredeknek fejlődő ARM utasításarchitektúrára építette fel legújabb, A64FX chipjét a japán vállalat.

Egyetlen processzor 48 darab általános számításokra befogható magot, illetve 4 darab dedikált segédmagot tartalmaz. Ezeket négy csoportba rendezte a Fujitsu, amelyeket egy körbusz NoC (Network-on-Chip) kapcsol össze. A csoportok mindegyikéhez egy darab 8 gigabájtos, rendkívül magas, 256 GB/s sávszélességre képes HBM2 chip kapcsolódik rendszermemória gyanánt. Ezzel a CPU aggregált memória-sávszélessége pontosan 1 TB/s, az összkapacitás pedig 32 gigabájt. A magok mellett egy 16 sávos PCI Express vezérlő, valamint a Fujitsu korábbi rendszereiből megismert Tofu (Torus fusion) interkonnekt is bekerült a chipbe (28 Gbps x 2 sáv x 10 port). A méretes lapka összesen 8,79 milliárd tranzisztort tartalmaz, elméleti maximális számítási teljesítménye pedig 2,7 TFLOPS körül mozog. A processzort az aktuális tömeggyártásban elérhető legfejlettebb gyártástechnológiával, a TSMC 7 nanométeres eljárásával termelteti a Fujitsu.

Az ARM 64 bites utasításarchitektúráját (AArch64, ARM v8.2) támogató processzora másik érdekessége, hogy az elsőként alkalmazza a brit cég SVE utasításkészletét. A Scalable Vector Extensions rugalmas megoldást kínál az egyedi processzorokat tervező cégeknek, a SIMD ugyanis 128-tól egészen 2048 bitig skálázható, 128 bites lépcsőkben. Az utasításkészlet nem csak nevében hasonlít az Intel AVX-ére (Advanced Vector Extensions), hisz mindkét megoldás vektorműveletek gyorsítására szolgál, ami az A64FX esetében (is) 512 bites végrehajtókat jelent.

Az ARM fejlesztésének hála az A64FX a konkurensekhez viszonyítva kifejezetten gyorsan képes különféle HPC-s és AI műveletek végrehajtására. A műveletek tárháza rendkívül széles, lebegőpontosból a dupla-, az egyszeres-, valamint a félpontosságú gyorsítása is támogatott, egészszámosból pedig az INT64/32/16/8 a végrehajtása támogatott. Utóbbiak teljesítménye kiemelten fontos a gépi tanulásos számítási műveletek gyorsítása miatt.

Utcahossznyi előny

Az informatika világában az innovatív, újszerű technológia megközelítések nem jelentenek automatikusan magasabb teljesítményt, illetve versenyképesebb termékeket. Az A64FX, valamint az arra épülő Fugaku szuperszámítógép és a PRIMEHPC szerverek ebből a szempontból határozott kivételt jelentenek. A japán állami kutatóintézet-hálózat RIKEN intézetében elhelyezett Fugaku ellentmondást nem tűrően vette át a vezetést a szuperszámítógépeket rangsoroló TOP500-as listán. A Fujitsu processzorára épülő rendszer előnyét jól szemlélteti, hogy a második helyre visszaszorított amerikai Summitnál 2,8-szor nagyobb számítási teljesítményre képes a Fugaku. Kizárólag az alacsonyabb pontosságú, gépi tanuláshoz alkalmazott műveleteknél a rendszer teljesítménye meghaladja a bűvös 1 exaflopsot.

A TOP500 mellett több más neves lista első helyét is meghódította a Fugaku: első helyet szerzett a valós fizikai alkalmazásokat futtató szuperszámítógépek HPCG listáján, a mesterséges intelligencia jellemző feladataihoz szükséges teljesítményképességeket vizsgáló HPL-AI szuperszámítógépes listán csakúgy, mint a nagy adatfeldolgozási teljesítményt igénylő feladatok elvégzésének képességét értékelő Graph 500-as listán. Most történt meg első ízben, hogy egyazon szuperszámítógép egyidejűleg szerezte meg a TOP500-as, a HPCG és a Graph 500-as lista első helyét.

Kicsiben is nagyot megy

A Fujitsu A64FX processzora, illetve az arra épülő platform nem csak számítási teljesítmény és hatékonyság, hanem skálázhatóságban szempontjából is az élvonalhoz tartozik. A 2U kivitelű PRIMEHPC FX700 szerver dupla pontosságú számításoknál akár 3,072 TFLOPS teljesítményre is képes lehet a 48 darab processzormagnak hála. A léghűtéssel működő kiszolgálóból egy szekrénybe nyolc darab telepíthető. A nagyobb rendszerekhez szabott PRIMEHPC FX1000 már 3,3792 TFLOPS-ra képes, ám ennél fontosabb különbség, hogy rackenként akár 384 node-ig is skálázható. A magasabb sűrűség okán ebben az esetben már vízhűtés gondoskodik a hőelvezetésről, az egyes node-ok közötti minél gyorsabb és hatékonyabb adatcserét pedig a Fujitsu által fejlesztett Tofu Interconnect D végzi.

A Regensburgi Egyetem Európában elsőként épített kutatási rendszert PRIMEHPC FX700-ra. A számítási kapacitást QPACE4 (QCD Parallel Computing Engine 4) projektjével aknázza ki az egyetem. Az új rendszer jelentősen javítja a kvantum-színdinamika (QCD) terén végzett numerikus szimulációkhoz szükséges számítási képességeket az intézmény tudósai számára. Ennek segítségével a kutatók jobban megismerhetik az alapvető részecskéket, azon belül pedig a proton belső szerkezetét, hogy végső célként meghatározzák az univerzum állapotát közvetlenül az ősrobbanás után. Az egyetem az immunológia és a rákkutatást támogató bioinformatika területén is használni fogja a szuperszámítógépet.

[Az Fujitsu megbízásából készített, fizetett anyag.]

Hozzászólások

„processzora másik érdekessége, hogy az elsőként alkalmazza a brit cég SVE utasításkészletét.”

Mivel az ARM tulaja a SoftBank, így a cég inkább japán és nem angol.

kétpontosságú számításoknál ---> dupla pontosságú számításoknál

kvantum-kromodinamika (QCD) ---> kvantum-színdinamika