[Pro] Intel Xeon E5-2699 v3 / Xeon E5-2650L v3 review: Haswell voor servers

15 reacties
2 besproken producten
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Xeon E5-2600 v3 versus E5-2600 v2
  3. 3. Xeon E5-2600 v3 CPU's en Wellsburg platform
  4. 4. Modellen
  5. 5. De basis: Haswell cores
  6. 6. AVX2 instructies
  7. 7. DDR4 geheugen: sneller en zuiniger
  8. 8. Stroombesparing
  9. 9. Verbeteringen voor virtualisatie
  10. 10. Cluster-on-die mode
  11. 11. Testplatform
  12. 12. Benchmarks Windows Server: HPC (3D-rendering en Financial Analysis)
  13. 13. Benchmarks Windows Server: HPC (Fluid Dynamics, Mathematics en Cryptografie)
  14. 14. Benchmarks Windows Server: Geheugenbandbreedte
  15. 15. Benchmarks Windows Server: Stroomverbruik en performance-per-watt
  16. 16. Benchmarks CentOS 6.6: Percona TPC-C MySQL benchmark
  17. 17. Benchmarks Ubuntu Server: Phoronix (1)
  18. 18. Benchmarks Windows 8.1: Workstation tests
  19. 19. Dell PowerEdge R730xd
  20. 20. Conclusie
  21. 2 besproken producten
  22. 15 reacties

Cluster-on-die mode

Een laatste nieuwe functionaliteit die niet onbesproken mag worden is de nieuwe methode die de Xeon E5 v3 CPU's hebben om caches coherent te houden.

Eerder in dit artikel merkten we al op dat het grote aantal cores van de nieuwe Xeons ervoor zorgt dat het aantal stops op de ringbus flink is toegenomen ten opzichte van voorgaande modellen en dus dat de latency bij communicatie tussen cores onderling of cores en daaraan gekoppelde segmenten van de L3-cache kan toenemen. Omdat de L3-cache in feite als één groot stuk gedeelde cache wordt aangestuurd, is de kans dat de data die een bepaalde core nodig heeft aan de andere kant van de chip aanwezig is net zo groot als dat de data in het direct aan de core gekoppelde L3-segment zit.

In verreweg de meeste applicaties is deze wat toegenomen latency geen issue, maar er zijn workloads waar de latency van de cache een belangrijker factor is dan de grootte ervan. Daartoe hebben de nieuwe Xeons een nieuwe optie, getiteld Cluster on Die, die via de BIOS ingesteld kan worden. Bij Cluster on Die, wat enkel mogelijk is bij de chip-varianten met twee home agents, ofwel de varianten met 10 of meer cores, worden de cores en de L3-cache in twee segmenten gesplitst. Deze gaan zich gedragen en doen zich ten opzichte van het besturingssysteem voor als zijnde fysieke multi-core CPU's. Ofwel: normaal gesproken ziet het OS een Xeon E5-2699 v3 als één 18-core CPU, met Cluster on Die ziet het OS twee 9-core CPU's, met elk dus de helft van de L3-cache. Mits het besturingssysteem NUMA-aware is - wat bij alle moderne OS'en het geval is - wordt ervoor gezorgd dat CPU-taken en de bijbehorende data bij elkaar blijven. Het maakt dat de cores dan nog enkel data uitwisselen met L3-cache segmenten die fysiek in de buurt zitten, wat de gemiddelde latency verlaagt. Ook het snoop verkeer, de data die intern wordt uitgewisseld om caches coherent te houden, krijgt gemiddeld een lagere latency. 

Vanzelfsprekend zijn er ook nadelen: de gedeelde L3-cache die voor cores beschikbaar is, is gehalveerd en voor taken die juist schalen naar veel cores kan de communicatie onderling juist ook weer wat langer duren. Hoe dan ook: voor zeer specifieke workloads kan Cluster on Die een mogelijkheid zijn om de prestaties wat te optimaliseren.


2 besproken producten

Vergelijk alle producten

Vergelijk   Product Prijs
Intel Xeon E5-2650L v3

Intel Xeon E5-2650L v3

  • Socket 2011-3
  • 1.8 GHz
  • 12 cores
  • 65 W
  • 22 nm
Niet verkrijgbaar
Intel Xeon E5-2699 v3

Intel Xeon E5-2699 v3

  • Socket 2011-3
  • 2.3 GHz
  • 18 cores
  • 145 W
  • 22 nm

€ 4.380,00

1 winkel
0
*