Preview: ARM's nieuwe CPU- en GPU-architecturen

6 reacties
Inhoudsopgave
  1. 1. ARM in 2018
  2. 2. ARM als stille kracht 
  3. 3. DynamIQ: Slim samenwerken 
  4. 4. Cortex-A55: Efficiëntie
  5. 5. Cortex-A75: High-performance 
  6. 6. GPU: Mali-G72 
  7. 7. Complete systemen 
  8. 8. Conclusie
  9. 6 reacties

Complete systemen 

ARM levert sinds een aantal jaar ook gehele systemen. Hierbij hoeven chipfabrikanten dus niet meer na te denken over zaken als caches, core-configuraties en interfaces, maar krijgen ze gewoon een kant en klaar ontwerp. Een voorbeeld van zo’n systeem was de CoreLink SGM-773, met vier Cortex-A73-kernen, vier Cortex-A53-kernen en een Mali-G71-gpu van 12 clusters. Zo’n systeem kan dus één op één overgenomen en geproduceerd worden door halfgeleiderfabrikanten.

Vandaag introduceert ARM twee nieuwe complete systemen voor mobiele apparaten. Beide bevatten zowel A75- als A55-cores en een Mali Bifrost-GPU, maar verschillen in de onderlinge prestaties. De SGM-775 is de krachtigste variant, met vier Cortex-A75-cores, een Mali-G72 en vier geheugenkanalen, terwijl de SGM-575 een compacter ontwerp is met twee Cortex-A75-cores, een Mali-G51 en twee geheugenkanalen.

  SGM-773 SGM-775 SGM-573 SGM-575
High-performance 4x A73 4x A75 2x A73 2x A75
Efficient 4x A53 4x A55 4x A53 4x A55
GPU Mali-G71 Mali-G72 Mali-T860 Mali-G51
Geheugen 4x DDR4 4x DDR4 2x DDR4 2x DDR4
Cluster configuratie big.Little DynamIQ big.Little DynamIQ

Beide nieuwe systemen hebben hun CPU-kernen in een DynamIQ-cluster, wat betekent dat er een gedeelde L3-cache ter beschikking is. In de systemen is ook een fully coherent cache geïmplementeerd. Dit houdt in dat de CPU en GPU een geheugenruimte kunnen delen, waarbij in dit geval de GPU ook toegang krijgt tot de L3-cache van de processors via de CoreLink-interface. Hierdoor hoeven de CPU en GPU niet meer op elkaar te wachten tot de cache is bijgewerkt, maar kunnen ze er tegelijkertijd gebruik van maken.

Naast mobiele systemen doet AMD ook een serieuze gooi naar de servermarkt. Afgelopen jaar zagen we Qualcomm al een eerste stap zetten met de introductie van de Centriq 2400, een 48-core ARMv8-processor die op 10nm geproduceerd wordt. ARM had zelf ook al een aantal ontwerpen klaar liggen voor serverprocessoren, maar die zijn nauwelijks gebruikt. Vandaag introduceert het bedrijf dus een flinke upgrade van deze processoren.

De nieuwe ontwerpen bestaan in de basis uit een groot aantal Cortex-A75-kernen die slim aan elkaar geknoopt zijn. Op een chip kunnen maximaal 32 clusters met elk 8 cores geïmplementeerd worden, goed voor 256 cores per chip. Ondanks dat een A75-kern niet zo krachtig is als bijvoorbeeld een Intel Skylake-kern, moet door het zeer grote aantal rekenkernen de processor aantrekkelijk worden voor bepaalde servertaken.

De clusters worden met elkaar verbonden via de CoreLink CMN-600-interface. Deze kan tot 8 geheugenkanalen en 32 CPU-clusters aansturen. Ook is er ruimte voor 96 IO-lijnen en kan er indien gewenst een systeembrede cache worden geplaatst van maximaal 128 MB. Er is ten opzichte van vorige ontwerpen ook flink meer bandbreedte ter beschikking voor de communicatie tussen de verschillende cores, IO- en geheugencontrollers.

Via CCIX, een vrij nieuwe interface, kunnen ook nog meerdere van deze chips aan elkaar gelinkt worden. Hierbij wordt het geheugensysteem gedeeld, zodat alle chips van dezelfde systeemcache gebruik kunnen maken. Het is daarmee mogelijk om meer dan 1000 CPU-cores in een server-node te krijgen, iets wat tot nu toe ondenkbaar was.

ARM biedt zelf ook twee kant-en-klare ontwerpen aan, die beide wat bescheidener zijn in dimensies. Er is een 32-core systeem genaamd SGI-775 en de 8-core variant heeft SGI-575, met respectievelijk 4 en 1 clusters met acht Cortex-A75-kernen. Het bedrijf claimt dat het nieuwe SGI-775-ontwerp 40% sneller moet zijn dan de vorige generatie SGI-572 met 32 Cortex-A72-kernen, hoewel hier waarschijnlijk ook een die-shrink bij zit.

0
*