AMD demonstreert 32-core Naples-SoC, lanceert in Q2

63 reacties

Met een marktaandeel van 99% domineert Intel al jarenlang de markt voor serverprocessoren. Volgend kwartaal moet daar een echter einde aan te komen, want AMD komt met Naples: 32 cores, 64 threads, 8 geheugenkanalen, 16 DIMM's en 128 PCIe 3.0-lanes per CPU. Op papier is het een beest.

Napels is opgebouwd uit dezelfde Zen-kernen die we ook in de recent geïntroduceerde Ryzen-processoren vinden. Er komen meerdere versies op de markt waarvan het aantal cores en de kloksnelheid variëren. Het topmodel zal 32 cores en 64 threads krijgen, wat flink meer is dan de maximale 22 kernen die Intel nu biedt.

Elke processor heeft acht geheugenkanalen. Per kanaal kunnen twee DDR4 DIMM's aangesloten worden, wat met 16GB DIMM's zorgt voor 256 GB aan geheugen per processor. Het geheugen is geklokt op maximaal 2677 MHz wat per kanaal 21.3 GB/s en in totaal 170 GB/s aan geheugenbandbreedte oplevert. De geheugencontroller is ook klaar voor DIMM's groter dan 16 GB, in totaal kan er namelijk 4 TB aan geheugen aangestuurd worden.

AMD verlaat met Naples het hele principe van een chipset. Alle benodigde functies, zoals het aansturen van de vele I/O-kanalen en DDR4-slots worden geïntegreerd op de die zelf. Het bedrijf claimt hiermee dat het integreren van de chipset de kosten verlaagt en performance verhoogt. Hiermee is Naples technisch gezien een system-on-a-chip en heeft dus enkel nog werk- en opslaggeheugen nodig om te functioneren.

Een grote uitdaging bij multi-socket servers is het samen laten werken van de verschillende CPU's. Elke CPU moet namelijk toegang hebben tot de meest recente data, anders worden er namelijk berekeningen met gegevens uitgevoerd die door een andere CPU alweer veranderd kunnen zijn. Om dit op te lossen maakt AMD gebruik van Infinity Fabric, een zelf ontworpen protocol om zeer snel data uit te kunnen wisselen tussen verschillende processing-eenheden. AMD claimt hiermee vrijwel perfecte schaalbaarheid tussen meerdere processoren.

Een Naples-processor verbindt met de buitenwereld door middel van 128 high-speed I/O-lanes. In veel gevallen zullen dit PCIe 3.0-lanes zijn, waarmee bijvoorbeeld 4 GPU's, 12 NVMe-SSD's en een aantal zeer snelle ethernetpoorten tegelijkertijd met de volle bandbreedte aangesloten kunnen worden. Wanneer twee processoren in dezelfde server worden gebruikt blijft het totale aantal I/O-lanes 128 en verdubbelt dit niet. Op dat moment worden namelijk 64 van deze lanes voor de communicatie tussen de twee processoren gebruikt als onderdeel van AMD's Infinity Fabric.

Opvallend is de manier van productie die AMD bij Naples gebruikt. Een Naples-processor bestaat in feite uit vier Zeppelin-dies, dezelfde die als in de huidige Ryzen-processoren. Deze die is 195,2 mm2 groot en bevat 4,8 miljard transistoren. Hiermee is meteen duidelijk waarom AMD vier losse dies gebruikt: een die van 780 mm2 is bijna onmogelijk te produceren, laat staan met een fatsoenlijke yield op een vrij nieuw proces. Bovendien hoeft er nu slechts een die geproduceerd te worden voor zowel de consumenten- en de serverprocessoren. We zullen hiermee ook zeer waarschijnlijk een 16-core versie bestaande uit twee dies gaan zien, welke zowel voor de server- als de consumentenmarkt gebruikt kan gaan worden.

AMD 8-core Zeppelin-die

Elke Zeppelin-die biedt 8 cores, 16 threads, 2 geheugenkanalen en 24 PCIe 3.0 lanes. Hoewel de eerste drie getallen netjes optellen, zijn er te weinig PCIe-lanes aanwezig. AMD zal daarom een bepaalde vorm van een multi-plexer op de SoC hebben geïntegreerd om tot het totale aantal van 128-lanes te komen. Wat de beperkingen zijn van het op deze manier samenstellen van een processor zullen we in toekomstige benchmarks moeten ondervinden.

Vergeleken met Intel's meest krachtige processor, de Xeon E5-2699A v4, zijn deze getallen erg indrukwekkend. Er zijn meer cores en threads aanwezig, er kan meer en sneller geheugen aangestuurd worden en het aantal I/O-lanes is flink hoger. In het overzicht hieronder laat AMD de verschillen duidelijk zien.

Om al deze getallen naar de echte wereld te vertalen heeft AMD op de Ryzen Tech Day een benchmark laten zien. Hoewel we deze benchmark nog niet hebben kunnen verifiëren ziet hij er indrukwekkend uit. Twee 32-core Naples-processoren namen het op tegen twee van Intel's topmodellen: de 22-core Xeon E5-2699A v4. Bij de eerste benchmark werd de geheugenklok en het aantal cores gelijk gezet op respectievelijk 44-core en 1866 MHz. AMD was toen twee keer zo snel door de testset heen. Vervolgens werd het geheugen opgeschroefd naar 2400 MHz en alle 64-cores ingeschakeld, waarna AMD zelfs 2,5 maal zo snel was. Tot slot werd de dataset verviervoudigd waarna de Intel-processor het opgaf vanwege een gebrek aan geheugencapaciteit.

De reden dat AMD veel sneller is in deze benchmark komt voornamelijk doordat AMD dus veel meer geheugenbandbreedte ter beschikking heeft. We weten uit eigen test dat de IPC van Ryzen ongeveer gelijk is aan Haswell. Bij compute-gelimiteerde workloads zal AMD met 32-cores zo'n 50% sneller zijn. Indien de geheugenbandbreedte echter de limiterende factor is zal AMD naar alle waarschijnlijkheid daadwerkelijk 2,5 maal zo snel zijn.

Intel zal aan het einde van het jaar met Skylake-EP direct op Naples gaan reageren. Skylake-EP verhoogt het aantal geheugenkanalen van 4 naar 6 en vermoedelijk zal de frequentie hiervan ook flink omhoog gaan. De IPC van Skylake is tussen de 5% en 10% hoger dan Haswell en ook bij Intel zal het aantal rekenkernen blijven stijgen. Aan het eind van het jaar kunnen we dus een ware oorlog in serverland verwachten, aangezien dit voor Intel een markt is die ze absoluut niet kunnen missen.

AMD luidt vandaag dus een nieuw tijdperk in serverprocessing aan. Het bedrijf heeft een processor geïntroduceerd met 45% meer cores, 122% meer geheugenbandbreedte en 60% meer I/O-lanes dan Intel's nieuwste 22-core Broadwell-platform. In benchmarks van AMD zelf verdubbelt het bedrijf de performance met een gelijk aantal cores en dezelfde geheugenfrequentie. Wanneer alle cores worden gebruikt en de geheugenfrequentie wordt opgekrikt is dit zelfs een factor 2,5. Samengevat: AMD is terug.

Op deze plaats stond content van een externe website, deze is verwijderd om ongewenste tracking-mogelijkheden te voorkomen.

Voor de geïnteresseerde: de volledige slides.

Bronnen: AMD blog, AMD press

« Vorig bericht Volgend bericht »
0
*