Intel Nehalem EX: 8-core CPU's voor high-end servers

16 reacties
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Beckton chip
  3. 3. 4-weg en 8-weg
  4. 4. Nehalem-EX vs. Vorige generatie
  5. 5. Westmere-EP vs. Nehalem-EX
  6. 6. Modelnummers
  7. 7. Dell R810
  8. 8. Dell R810 (Vervolg)
  9. 9. Benchmarks
  10. 10. Conclusie
  11. 11. Besproken producten
  12. 12. Reacties

Inleiding

Eind 2008 introduceerde Intel met de Core i7 desktopprocessor de Nehalem processorarchitectuur. De vernieuwingen bestonden ondermeer uit de integratie van de geheugencontroller binnen de processor, de komst van de nieuwe QuickPath chip-naar-chip verbinding, de terugkeer van HyperThreading en de Turbo modus. Een paar maanden later kwam de Nehalem architectuur in de vorm van de Xeon 5500 processor ook beschikbaar voor dual-socket servers. Sinds begin dit jaar heeft Intel ook Nehalem processors beschikbaar voor notebooks. Daarmee zijn bijna alle productsegmenten voorzien. Het laatst overgebleven deel van de markt is vandaag aan de beurt, met de introductie van de Nehalem-EX processors (codenaam Beckton). Intels nieuwe architectuur komt nu ook beschikbaar voor high-end server met 4, 8 of nog meer sockets.

In onze berichtgeving over de Nehalem architectuur de laatste jaren, hebben we al vaker geschreven dat de vernieuwingen in de architectuur juist bij systemen met veel processors tot hun recht komen. Door de integratie van de geheugencontroller schaalt het aantal geheugenkanalen binnen een systeem immers voor het eerst met het aantal aanwezige processors. Dankzij de QuickPath interface kunnen alle processors voor het eerst rechtstreeks met elkaar communiceren, zodat alle communicatie niet langer via een centrale chipset hoeft te lopen.

Intel heeft haar Nehalem architectuur voor het MP-server segement flink uitgebreid. Ondanks dat de processors nog gebaseerd zijn op het 45nm productieprocedé heeft Intel de processors ondermeer uitgevoerd met 8 cores, 24 MB L3-cache, vier DDR3-geheugenkanalen en vier QuickPath verbindingen. Met 2,3 miljard transistors is Beckton de meest complexe processor die tot nu toe de fabrieken van Intel heeft verlaten. De nieuwe processors komen op de markt als Xeon 7500 reeks en zijn bedoeld voor mission critical enterprise toepassingen. In dit artikel bespreken we de specificaties en mogelijkheden van de nieuwe processors en bekijken we één van de eerste servers die er gebruik van maken, de Dell R810.

In de afbeelding hierboven zien we schematisch hoe het Xeon MP platform zich de afgelopen vijf jaar heeft ontwikkeld. Links zie je de opbouw van een 4-socket systeem met Xeon MP processors uit 2005, destijds nog gebaseerd op de Pentium 4 architectuur. Alle vier de processors zijn via een gedeelde frontside bus verbonden met de chipset. Die frontside bus is duidelijk de bottleneck binnen het systeem; wanneer één van de CPU's deze in gebruik heeft, is externe communicatie voor de andere CPU's tijdelijk niet mogelijk. Met de Clarksboro Xeon chips in 2007 (gebaseerd op de Intel Core architectuur) werd het probleem al gedeeltelijk opgelost door iedere processor met een eigen frontside bus te verbinden met de chipset. Nog altijd bleef de bottleneck bestaan dat een trip langs de chipset nodig was wanneer twee CPU's data wilden uitwisselen, of wanneer de geheugenmodules aangesproken dienden te worden. Rechts zien we het nieuwe platform, zoals Intel dat vandaag introduceert: de geheugenmodules zijn rechtstreeks verbonden met de processors en dankzij QuickPath kunnen alle chips binnen de server rechtstreeks met elkaar communiceren. Intel belooft dan ook een ongekende prestatiewinst ten opzichte van de vorige generatie.

Beckton chip

De Nehalem EX chip, codenaam Beckton, wordt geproduceerd middels het 45nm productieprocedé. De chip bevat circa 2,3 miljard transistors, ongeveer het dubbele van het aantal in de afgelopen maand geïntroduceerde en door Hardware.Info uitgebreid besproken 6-core Westmere processors voor 2-weg servers. Zeker als je bedenkt dat Westmere wordt gemaakt met kleinere 32 transistors, mag je wel concluderen dat Nehalem EX een gigantische chip is, die Intels 45nm proces tot het uiterste drijft. De Beckton chips maken gebruik van de nieuwe Socket 1567 processorvoet.

Intel Xeon X7560
Intel Nehalem EX met Socket 1567 van boven- en onderkant.

De Beckton chip bestaat uit 8-cores, het dubbele aantal van de bestaande Nehalem-processors in de 45nm generatie. De van de andere Nehalem processors bekende HyperThreading technologie is ook bij Nehalem EX aanwezig: iedere core kan gelijktijdig instructies van twee programmathreads verwerken. Zodoende doet een enkele Nehalem EX processor zich ten opzichte van het besturingssysteem voor als een 16-core CPU. Met vier Beckton chips in één server, ziet het besturingssysteem 64 cores. Iedere core heeft 256 kB eigen L2-cache. Daarnaast bevat de Beckton processor 24 MB gedeelde L3-cache, twee keer zoveel als de Westmere processors. Iedere Beckton processor heeft een vierkanaals DDR3-geheugencontroller aan boord. Tenslotte is er een viertal QuickPath interfaces om de processors onderling en met de chipset te verbinden. Dankzij de vierde QuickPath bus kunnen de Nehalem EX processors ook in systemen met meer dan twee processors gebruikt worden. 4-weg en 8-weg systemen zullen het meest voorkomen, maar theoretisch ligt het maximum op liefst 256 CPU's.

In bovenstaande afbeelding zie je een blokschema van de Beckton chip. Hierin zien we ondermeer dat de 24 MB L3-cache is opgedeeld in 8 afzonderlijke blokken van 3 MB. Al die blokken kunnen gelijktijdig voor verschillende cores gebruikt worden. Op die manier bewerkstelligt Intel een zo hoog mogelijk bandbreedte tussen cores en cache. In theorie kunnen cores en L3-cache met zo'n 200 GB/s met elkaar communiceren. De L3-cache is volledig inclusive, wat betekent dat data uit de L2-caches van de verschillende cores altijd per definitie identiek in de L3-cache staat. Op die manier is een intern snoop filter overbodig: core x kan bekijken of een bepaald stuk data dat hij wil gaan schrijven toevallig in de L2-cache van een andere core staat door simpelweg de L3-cache te bekijken en daarmee de andere cores niet te storen. Ook andere processors kunnen via de QuickPath interface de caches van de externe cores controleren door even de L3-cache te bekijken.

Om de verschillende chip onderdelen op hoge snelheid met elkaar te laten communiceren, vinden we midden in de chip een router blok. Deze router is verbonden met de L3-cache, de twee dual-channel geheugencontroller en de viervoudige QuickPath interface. Om zo snel mogelijke communicatie te bewerkstelligen kunnen geheugencontroller en L3-cache ook rechtstreeks met elkaar communiceren.

De quad-channel geheugencontroller kan verbonden worden met zogenaamde Scalable Memory Buffer chips die op een Nehalem EX moederbord een plaats vinden. Eén zo'n SMB neemt twee geheugenkanalen voor z'n rekening nemen en met elk van die kanalen kunnen vier DIMM's worden verbonden. Per Nehalem-EX processor kun je zodoende maximaal 16 DIMM's aansturen. In een 4-socket systeem heb je dus met DIMM's van 4 GB per stuk de beschikking over 256 GB geheugen. Wie investeert in peperdure 16 GB DIMM's zou tot een terabyte aan geheugen kunnen gaan in een vierweg systeem. Voor de cores is er een latency van circa 108 nanoseconden om direct verbonden geheugen te adresseren. Voor geheugen dat met een andere CPU verbonden is geldt een gemiddelde toegangstijd van 161 nanoseconden.

RAS features

Nehalem-EX kenmerkt zich verder door een groot aantal reliability features, zoals dat gebruikelijk is in het segment van 4- en 8-weg servers. De lijst zogenaamde RAS features (Reliability, Availability and Serviceability) is erg lang. Zo kunnen falende geheugenmodules automatisch uitgezet worden, is het mogelijk om terwijl de server draait geheugenmodules en zelfs processors te vervangen, is er een mogelijkheid om geheugenmodules te mirrorren (een soort RAID 1 voor geheugenmodules), zit er op alle bussen binnen het systeem verregaande foutcorrectie en zo verder. Onderstaand overzicht geeft een beeld van de belangrijkste RAS-features.

4-weg en 8-weg

De Nehalem-EX processors zijn primair bedoeld voor systemen met vier of meer processors. Dankzij de vier QuickPath interfaces per processor, zijn in een vier socket systemen alle processors rechtstreeks met elkaar verbonden. Op onderstaande afbeelding zie je een typische opbouw van een 4-weg Nehalem EX-systeem. Iedere processor heeft een QuickPath verbinding naar iedere andere processor. Een 4-weg Nehalem-EX systeem kan afhankelijk van de behoefte aan PCI-Express lanes voorzien worden van één of twee bijbehorende chipsets. De zogenaamde Boxboro chipset is telkens met twee QuickPath verbindingen verbonden met twee CPU's. Van een willekeurige CPU naar de chipset is zodoende dus maximaal twee hops. Iedere Boxboro chipset biedt 36 PCI-Express 2.0 lanes. Een 4-weg Nehalem EX systeem heeft zodoende dus in potentie 72 PCI-Express lanes beschikbaar voor uiteenlopende uitbreidingskaarten. In totaal is er in een dergelijk systeem een 16-tal DDR3-geheugenlanes beschikbaar.

De typische opbouw van een 8-socket systeem ziet er uit als hieronder. In dit geval bestaat er niet langer een directe verbinding tussen elke willekeurige combinatie van twee processors. Zoals in het schema te zien, zijn vanuit iedere processor een drietal andere te bereiken via een directe verbinding, voor de overige vier is een tweede hop vereist. Een 8-weg Nehalem-EX systeem kan indien gewenst worden voorzien van een viertal Boxboro chipsets, wat resulteert in 144 beschikbare PCI-Express 2.0 lanes. Een 8-weg systeem zou in totaal 64 echte cores en 128 virtuele cores hebben.

Nehalem-EX vs. Vorige generatie

De huidige 6-core Xeon MP processors uit de 7400 serie met codenaam Dunnington zijn nog gebaseerd op de Core-architectuur en missen de binnen Nehalem belangrijke features als HyperThreading, de geïntegreerde geheugencontroller en de QuickPath interface. Als we de vergelijking trekken tussen een 4-weg Xeon 7400 server en een 4-weg Xeon 7500 Nehalem-EX server, dan zien we dat Intel flinke stappen heeft gemaakt. Het aantal cores binnen een vierweg systeem stijgt van 24 naar 32. Het aantal virtuele cores van 24 naar 64, een toename met een factor 2,6. De Xeon 7400 processors hadden maximaal 16 MB L3-cache, de Xeon 7500 gaan tot 24 MB, een factor 1,5 verschil.

Grote verschillen zijn er op het vlak van het geheugen. Bij het Xeon 7400 platform zat de geheugencontroller nog in de chipset. Alle processors deelden een enkele quad-channel geheugencontroller, die maximaal 16 FB-DIMM modules gebaseerd op DDR2-technologie kon aansturen. Een Nehalem-EX systeem kan sowieso al potentieel 4x meer DIMM's huisvesten. De totaal beschikbare bandbreedte is een factor 9 hoger.

Het aantal RAS-features is bij Nehalem-EX met een factor drie toegenomen ten opzichte van de vorige generatie. Waar de Xeon 7400's met maximaal 16 processors in één systeem geplaatst konden worden, schaalt Nehalem-EX tot maximaal 256 CPU's, een factor 16 verschil. Tenslotte is het aantal beschikbaar PCI-Express lanes in een vierweg systeem ook met een factor 2,5 toegenomen. We mogen dus wel concluderen dat Intel een flinke stap heeft gezet met deze nieuwe generatie.

Westmere-EP vs. Nehalem-EX

De vraag dringt zich natuurlijk op hoe we Nehalem EX moeten positioneren ten opzichte van de eerder deze maand geïntroduceerde Xeon 5600 Westmere processors. Het belangrijkste is natuurlijk dat Westmere maximaal schaalt naar twee CPU's per server. Nehalem-EX biedt de mogelijkheid om tot maximaal 256 processors in één server te plaatsen, waarbij 4-weg en 8-weg systemen het meest gangbaar zullen zijn.

Intel Xeon X7560
Link: Nehalem-EX (Socket 1567) / Rechts: Westmere-EP (Socket 1366)

Het aantal cores kwam al ter sprake: in het 2-weg segment biedt Intel met Westmere maximaal 6 cores per processors. Bij Nehalem-EX zijn dat er maximaal 8. De geïntegreerde level 3 cache verschilt met een factor twee: 24 MB in plaats van 12 MB.

Waar Nehalem-EX zich verder vooral differentieert van de dual-socket servers is de mogelijkheid om gigantisch op te schalen wat betreft geheugencapaciteit. Westmere ondersteunt maximaal 9 DIMM-slots en daarmee 144 GB geheugen per socket. Met maximaal twee sockets kom je zo op maximaal 18 DIMM's en 288 GB geheugen per server. Nehalem-EX ondersteunt 16 modules per socket en daarmee maximaal 256 GB geheugen per CPU. In een vierweg server kun je op die manier potentieel 1 TB geheugen aansturen, in een achtweg server zelfs 2 TB. Door het extra geheugenkanaal is de geheugenbandbreedte bij Nehalem-EX ook wat hoger. Verder biedt Nehalem-EX veel meer RAS-features van Westmere, waardoor het eenvoudiger is om een server hebben met een zeer hoge uptime.

Waar Westmere een streepje voor heeft, is bij de klokfrequenties. De Xeon 5600 zijn verkrijgbaar op klokfrequenties tot 3,33 GHz, de snelste Nehalem-EX chip werkt op 2,26 GHz. In onderstaand schema zijn de verschillen duidelijk te zien.

Intel positioneert beide platformen duidelijk voor andere doelgroepen. Wie bijvoorbeeld een webserver, mailserver of HPC cluster gaat uitrollen, is beter af met één of meerdere dual-socket Westmere-EP processors. Voor zware database servers, ERP-systemen en mission critical zakelijke servers is Nehalem-EX een betere keuze. Onderstaand schema geeft dat duidelijk weer. Rood zijn de gebieden waar een Westmere-EP systeem beter zou fungeren, blauw de gebieden waar Nehalem-EX kan excelleren.

Modelnummers

Tranditioneel was de scheidslijn bij Intel vrij eenvoudig: de Xeons uit de 5000-serie waren geschikt voor dual-socket systemen, de Xeons uit de 7000-serie waren geschikt voor 4-weg en grotere servers. In de basis gaat die stelregel nog steeds op, maar met een subtiel verschil. Ook in een dual-socket set-up biedt Nehalem-EX zoals we op de voorgaande pagina hebben gezien een aantal voordelen boven Xeon 5600 processors, waaronder de extra RAS-features en de mogelijkheid om veel meer geheugen te adresseren. Vandaar dat Intel voor het eerst ook processors in het hogere segment introduceert die puur geschikt zijn om in een tweeweg systeem te werken. De eerste cijfers van het modelnummer geven het verschil aan: de Xeon 7500 chips kunnen zonder extra chips schalen tot maximaal 4 of 8 sockets, de Xeon 6500 processors blijven beperkt tot twee sockets.

Het topmodel is de Xeon X7560 die werkt op 2,26 GHz. Deze chip heeft 8-cores, 24 MB L3-cache en een TDP van 130 Watt. Dankzij de Turbo Modus kan de klokfrequentie maximaal 400 MHz toenemen. De daaronder gepositioneerde X7550 werkt op 2,0 GHz en heeft 18 MB L3-cache. Onderstaand overzicht toont de overige Xeon 7500 modellen, waarbij duidelijk is dat bij de goedkopere modellen het aantal cores, de hoeveelheid L3-cache en/of de Turbo Modus worden beperkt.

Het topmodel in de 6500 reeks is de X6550, werkend op 2 GHz met 8 cores, 18 MB L3-cache en een 130 Watt TDP. De twee andere 6500 Xeons hebben minder cores, een minder geavanceerde Turbo Modus en in het geval van de E6510 ook minder cache en een lagere geheugensnelheid.

Dell R810

Om wat ervaring op te doen met het nieuwe platform, gingen we aan de slag met een prototype van de Dell R810 server, één van de eerste servers geschikt voor Nehalem EX, voorzien van een tweetal Xeon X7560 processors. Deze server past geheel in de nieuwe filosofie van Intel om dergelijke server te verkopen met twee processors en gebruikers de mogelijkheid te geven om te upgraden naar maximaal vier. Dell heeft haar R810 voorzien van een speciale technologie: in de twee niet gebruikte sockets zitten speciale adapters die het mogelijk maken dat de op deze sockets aangesloten geheugensloten toch gebruikt worden. Ofwel: zelfs wanneer voorzien van slechts twee processors kan de volledige geheugencapaciteit benut worden.


Dell R810 Nehalem EX server

De R810 heeft in totaal 32 DDR3 geheugenslots, 8 per socket. De configuratie zoals wij ermee aan de slag gingen was volledig bezet met 4 GB DIMM's, ofwel 128 GB geheugen in totaal. In onderstaande foto zie je onder de kleine zwart koelblokjes tussen de geheugenmodules de memory buffers zitten. Van de vier sockets zijn de middelste twee bezet, te zien aan het koelblok. De buitenste twee sockets bevatten de speciale Dell adapter die het mogelijk maakt alle geheugenslots te gebruiken.


128 GB geheugen dankzij 32 modules van 4 GB

Hieronder een shot van het binnenwerk van de server zodra we rij fans en de koelblokken hebben verwijderd. De vier Socket 1567 voeten zijn naast elkaar gepositioneerd. In de middelste twee zitten de Xeon X7560 processors, in de buitenste twee de adapters om de geheugenmodules te gebruiken.


Twee Xeon X7560 processors en daarnaast twee adapters


Dells speciale socketadapter die het mogelijk maakt om in een systeem met twee CPU's toch alle geheugensloten te gebruiken.

Dell R810 (Vervolg)

Nehalem-EX machines zullen in de praktijk vaak gevirtualiseerd ingezet worden. Het grote aantal cores en de mogelijkheid om heel veel geheugen te plaatsen, maken deze machines bij uitstek geschikt om meerdere workloads gelijktijdig te draaien en dus bijvoorbeeld meerdere bestaande servers te consolideren naar één nieuw exemplaar. Om het gebruik van virtualisatie te vereenvoudigen, heeft Dell voorin de machine een tweetal 2 GB SD-kaartjes in een soort RAID 1 configuratie geplaatst. Hierop kan indien gewenst de virtualisatie hypervisor, zoals bijvoorbeeld VMWare ESX, worden geïnstalleerd. Door deze implementatie maakt de hypervisor veel meer dan gebruikelijk deel uit van de server en is deze niet meer afhankelijk van de lokale storage. De in de server geplaatste harde schijven kunnen dan volledig gebruikt worden voor virtuele installaties van besturingssystemen. Op deze manier is het zelfs relatief eenvoudig om de server in te zetten met in z'n geheel geen lokale storage en alle virtuele installaties te gebruiken vanaf bijvoorbeeld een NAS. Een internet USB-poort biedt de mogelijkheid om de inwendige flash storage waar nodig uit te breiden.

De Dell R810 server heeft vooraan een zestal 2,5" drivebays. De server zoals wij hem ontvingen was voorzien van een vijftal 146 GB 15k rpm SAS-drivers, maar ook SSD's behoren tot de mogelijkheden als je een R810 bij Dell gaat samenstellen. De voor deze server geschikt Dell PERC H800 RAID-controller heeft de beschikking over 512 MB cache en heeft een Li-Ion accu om bij stroomuitval de dataintegriteit te waarborgen.

Om het in gebruik nemen van de server zo snel mogelijk te laten verlopen, heeft Dell een aantal interessante technologieën toegepast. Zo maakt de deployment wizard bij deze server onderdeel uit van de EFI-BIOS. Achterin de machine vinden we een derde SD-kaart, met daarop de drivers voor alle voor de hand liggende besturingssystemen, waaronder Windows Server 2008 R2 en Redhet Enterprise Linux. Doordat de deployment wizard vanuit de BIOS is op te roepen, hoef je geen gebruik meer te maken van speciale CD's of DVD's. En doordat het configureren van de RAID-controller onderdeel uitmaakt van de wizard en Dells installatiehulp de Windows en Linux installatie vrijwel unattended maakt, is het gewenste besturingssysteem in de regel binnen een half uurtje geïnstalleerd.

Vanzelfsprekend heeft de Dell R810 twee voedingen aan boord en kunnen vrijwel alle onderdelen van de server, waaronder alle fans, tijdens gebruik vervangen worden. Via Dells remote management tools kan de status van alle onderdelen binnen de server op een goede manier in de gaten worden gehouden. Erg handig is ook het kleine LCD-display aan de voorzijde van de server, wat naast de status van de server ook handige informatie als de servernaam, het MAC-adres of het IP-adres kan tonen. Wie in een datacenter rekken vol met servers moet beheren, kan zich voorstellen hoe handig is het is belangrijke informatie even snel op een klein schermpje direct op de server te kunnen opvragen.

De Dell R810 is tenslotte standaard voorzien van een viertal Gigabit netwerkpoorten. De functionaliteit van de server kan verder middels PCI-Express kaarten worden uitgebreid.

Wij testten de server zowel in combinatie met Windows Server 2008 R2 als Redhat Enterprise Linux. Wie een machine als deze onder Windows Server wil gaan draaien, zal moeten kiezen voor de Enterprise editie, aangezien de standaard editie is beperkt tot 32 GB geheugen. Onderstaand screenshot toont hoe Windows de 32 virtuele cores van de server met twee X7560 processors keurig herkent:

Benchmarks

Vier pagina's terug schreven we al dat Nehalem-EX door Intel wordt gericht op andere gebruiksdoelen dan de de Xeon CPU's die bestemd zijn voor dual-socket machines, zoals de recent door ons geteste Xeon X5600 CPU's. Het EX-platform moet het hebben van de grote schaalbaarheid in cores, geheugen en de zeer uitvoerige RAS-features, terwijl de Xeon 5000-reeks gericht is op zo goed mogelijke prestaties met een beperkt aantal sockets. De 5000 chips lenen zich zodoende uitstekend voor webservers, mail/groupware-servers en HPC-nodes, terwijl de 7000 chips eerder hun weg vinden in servers die bijvoorbeeld SAP or Oracle draaien om bedrijfsprocessen van grote bedrijven draaiende te houden. De set server benchmark die we binnen Hardware.Info gebruiken, leent zich minder goed voor het segment waar de Nehalem-EX CPU's op gericht zijn: het gros van onze benchmarks zijn immers HPC workloads. Desalniettemin hebben we een aantal van onze server benchmarks toch gedraaid op de Dell R810. Een uitgebreide beschrijving van de diverse benchmarks, vind je in onze recente test van de Westmere-EP processors. Wij liepen overigens tegen wat problemen aan bij het uitvoeren van onze MySQL benchmark op de Nehalen-EX machine. Op dit moment zoeken we samen met Intel naar een oplossing, de scores hou je van ons te goed.

In de tabel zien we dat de combinatie van twee zes-core Xeon X5680 processors over de gehele linie iets beter presteert dan de combinatie van twee acht-core Xeon X7560 processors. Het verschil in aantal cores (totaal 16 in plaats van 12) weegt duidelijk niet op tegen het flinke verschil in klokfrequentie (3,33 GHz voor de X5680's en 2,26 GHz voor de X7560's). Maar zoals gezegd; onze benchmarks kunnen geen profijt halen uit bijvoorbeeld de gigantische hoeveelheid geheugen van de Dell server.

Processor Dual Xeon X5680 Dual Xeon X7560
Windows Server 2008 R2 benchmarks (hoger = beter)
Cinebench 10 36986 27312
Cinebench 11.5 17,24 14,87
Windows Server 2008 R2 benchmarks (lager = beter)
SunGard AA 88,9 sec. 97,5 sec.
Caselab Euler3D benchmark 19,52 sec. 19,8 sec.
Half Life 2 - Build Map benchmark 45 sec. 77 sec.
PovRay 3.7b21 - Chess2 1280x1024 21,0 sec. 24,2 sec.
FlamMap FSPRO benchmark 165 sec. 201 sec.
CentOS 5.4 benchmarks (lager = beter)
Parsec 2.1 - Blackscholes 31,2 sec. 44,6 sec.
Parsec 2.1 - Bodytrack 24,6 sec. 55,4 sec.
Parsec 2.1 - Canneal 56,2 sec. 95,0 sec.
Parsec 2.1 - Dedup 11,5 sec. 18,6 sec.
Parsec 2.1 - Facesim 104,3 sec. 147,6 sec.
Parsec 2.1 - Ferret 24,5 sec. 32,0 sec.
Parsec 2.1 - Fluidanimate 44,5 sec. 69,1 sec.
Parsec 2.1 - Freqmine 502,5 sec. 714,1 sec.
Parsec 2.1 - Raytrace 74,4 sec. 86,6 sec.
Parsec 2.1 - Streamcluster 79,7 sec. 135,6 sec.
Parsec 2.1 - Swaptions 36,6 sec. 24,4 sec.
Parsec 2.1 - Vips 9,7 sec. 12,3 sec.
Parsec 2.1 - x264 9,3 sec. 15,4 sec.

Conclusie

Eerder concludeerden we al dat de Nehalem architectuur juist z'n ware kracht kan tonen in systemen met meerdere processors. Nu de architectuur eindelijk z'n weg heeft gevonden naar het MP-serversegment, zijn de voordelen van de nieuwe architectuur helemaal evident. Dankzij de geïntegreerde geheugencontroller blijven de geheugencapaciteit en -snelheid meeschalen met het aantal processors. In een 4-weg systeem kan er in potentie tot 1 TB aan werkgeheugen geplaatst worden. Dankzij QuickPath kunnen processors snel onderling met elkaar communiceren en kan er relatief eenvoudig een 8-socket systeem worden ontworpen, zonder dat daar extra chips voor nodig zijn. Intel heeft verder het aantal cores en de L3-caches verhoogd tot wat maximaal met de stand van de techniek mogelijk is.

Nehalem-EX is gericht op bedrijfskritische servers. Vooral in gevirtualiseerde omgevingen zal de nieuwe architectuur goed tot z'n recht komen: met tot 32 cores in een 4-weg systeem biedt Nehalem-EX de rekenkracht en schaalbaarheid om vele bestaande servers te virtualiseren naar één nieuwe machine.

Verschillende serverfabrikanten komen spoedig met Nehalem-EX gebaseerde machines op de markt. Onze eerste ervaringen met de Dell R810 zijn positief. Dell speelt slim in op Intels nieuwe strategie om de processor uit dit segment ook in dual-CPU configuraties aan te bevelen: dankzij de speciale socket adapters kunnen alsnog alle geheugensloten worden gebruikt. Dat maakt dat het platform nu ook geschikt is voor workloads waarbij er niet zozeer behoefte is aan veel cores of veel rekenkracht, maar wel behoefte aan veel geheugen. Twee Xeon 5600 processors zijn immers te combineren met maximaal 288 GB, in de Dell machine zijn twee Xeon 6500 of 7500 processors te combineren met maximaal 1 TB geheugen. De extra RAS-features zorgen er vervolgens voor dat deze servers verder voor de meest kritische diensten kunnen worden ingezet.

Met Nehalem-EX is Intel ook klaar om opnieuw de concurrentie aan te gaan in het high-end serversegment met AMD. Zij komen immers met de 12-core Magny-Cours processors, die net als Nehalem-EX ook vier DDR3-kanalen per socket kunnen aansturen en eenvoudig kunnen opschalen naar 4-socket, 8-socket en nog zwaardere servers. Tot nu toe had AMD dankzij ondermeer HyperTransport een flink streepje voor in dit segment, nu zijn de bedrijven veel meer aan elkaar gewaagd.

De komende weken en maanden zullen zowel Intel als AMD vermoedelijk vele resultaten van zware benchmarks als TPC-C en TPC-H gaan publiceren. We zullen dan gaan zien hoe Nehalem-EX en Magny-Cours ten opzichte van elkaar presteren in het enterprise segment.

Intel Xeon X7560


Besproken producten

Vergelijk alle producten

Vergelijk  

Product

Prijs

Intel Xeon E7520

Intel Xeon E7520

  • Socket 1567
  • 1.86 GHz
  • 4 cores
  • 95 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon E7540

Intel Xeon E7540

  • Socket 1567
  • 2 GHz
  • 6 cores
  • 105 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon X7550

Intel Xeon X7550

  • Socket 1567
  • 2 GHz
  • 8 cores
  • 130 W
  • 45 nm
Niet verkrijgbaar
Intel Xeon X7560

Intel Xeon X7560

  • Socket 1567
  • 2.26 GHz
  • 8 cores
  • 130 W
  • 45 nm
Niet verkrijgbaar
0
*