Cluster-on-die mode
Een laatste nieuwe functionaliteit die niet onbesproken mag worden is de nieuwe methode die de Xeon E5 v3 CPU's hebben om caches coherent te houden.
Eerder in dit artikel merkten we al op dat het grote aantal cores van de nieuwe Xeons ervoor zorgt dat het aantal stops op de ringbus flink is toegenomen ten opzichte van voorgaande modellen en dus dat de latency bij communicatie tussen cores onderling of cores en daaraan gekoppelde segmenten van de L3-cache kan toenemen. Omdat de L3-cache in feite als één groot stuk gedeelde cache wordt aangestuurd, is de kans dat de data die een bepaalde core nodig heeft aan de andere kant van de chip aanwezig is net zo groot als dat de data in het direct aan de core gekoppelde L3-segment zit.
In verreweg de meeste applicaties is deze wat toegenomen latency geen issue, maar er zijn workloads waar de latency van de cache een belangrijker factor is dan de grootte ervan. Daartoe hebben de nieuwe Xeons een nieuwe optie, getiteld Cluster on Die, die via de BIOS ingesteld kan worden. Bij Cluster on Die, wat enkel mogelijk is bij de chip-varianten met twee home agents, ofwel de varianten met 10 of meer cores, worden de cores en de L3-cache in twee segmenten gesplitst. Deze gaan zich gedragen en doen zich ten opzichte van het besturingssysteem voor als zijnde fysieke multi-core CPU's. Ofwel: normaal gesproken ziet het OS een Xeon E5-2699 v3 als één 18-core CPU, met Cluster on Die ziet het OS twee 9-core CPU's, met elk dus de helft van de L3-cache. Mits het besturingssysteem NUMA-aware is - wat bij alle moderne OS'en het geval is - wordt ervoor gezorgd dat CPU-taken en de bijbehorende data bij elkaar blijven. Het maakt dat de cores dan nog enkel data uitwisselen met L3-cache segmenten die fysiek in de buurt zitten, wat de gemiddelde latency verlaagt. Ook het snoop verkeer, de data die intern wordt uitgewisseld om caches coherent te houden, krijgt gemiddeld een lagere latency.
Vanzelfsprekend zijn er ook nadelen: de gedeelde L3-cache die voor cores beschikbaar is, is gehalveerd en voor taken die juist schalen naar veel cores kan de communicatie onderling juist ook weer wat langer duren. Hoe dan ook: voor zeer specifieke workloads kan Cluster on Die een mogelijkheid zijn om de prestaties wat te optimaliseren.
2 besproken producten
Vergelijk | Product | Prijs | |
---|---|---|---|
![]() |
Intel Xeon E5-2650L v3
|
Niet verkrijgbaar | |
![]() |
Intel Xeon E5-2699 v3
|
€ 4.380,001 winkel |