Test: hoeveel PCI-Express lanes is optimaal voor SLI?

41 reacties
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Lanes
  3. 3. Test
  4. 4. Resultaten
  5. 5. Conclusie
  6. 6. Reacties

Inleiding

Waarom zou je voor een Socket 2011 systeem kiezen, boven een aanmerkelijk goedkopere Socket 1150 configuratie? Een veelgehoord argument is ‘betere ondersteuning voor SLI’ op het eerstegenoemde platform. Maar is dat wel zo? Hardware.Info testte het verschil in de praktijk.

Het zal geen nieuws voor je zijn als hardwareliefhebber: Intel heeft voor desktopsystemen op dit moment twee platforms beschikbaar. Socket 1150 is er voor alles van de goedkoopste Celeron processors tot aan de populaire Core i7 4770K. Daarnaast is er ook nog het high-end Socket 2011 platform met de bijna 1000 euro kostende Core i7 4960X als topmodel.

De goedkoopste Socket 2011 processor, de Core i7 4820K, is vrijwel net zo duur als het topmodel uit de Socket 1150 reeks, de genoemde Core i7 4770K. Socket 2011 moederborden met Intel X79 chipset zijn in de regel duurder dan Socket 1150 moederborden met Intel Z87 chipset. Waarom zou iemand dan voor een duurder Socket 2011 systeem moeten kiezen?

De meest voor hand liggende reden: alleen voor Socket 2011 zijn zes-core processors beschikbaar, al mag je daar minimaal 500 euro voor investeren. Voor workloads als video- of 3D-rendering, die goed schalen naar een groot aantal cores, kan dat een flinke impuls geven aan de prestaties van de machine. Echter, nog veel meer software kan nog niet eens gebruik maken van vier cores, laat staan zes stuks optimaal benutten. Games zijn daar een mooi voorbeeld van: als er al een prestatieverschil is, weegt dat over het algemeen niet op tegen het prijsverschil tussen processors.

Er zijn echter meer redenen om voor een Socket 2011 systeem te kiezen, vandaar ook dat Intel met de Core i7 4820K ook een variant met vier cores beschikbaar heeft. Een ander voordeel van het high-end platform is namelijk dat de processors een quad-channel geheugencontroller aan boord hebben, tegenover dual-channel bij Socket 1150 CPU’s. Dat betekent in feite een verdubbeling van de bandbreedte tussen CPU en geheugen. Waar dat voor bepaalde professionele c.q. server workloads voordelen kan hebben, kennen wij weinig consumententoepassingen die hier goed van profiteren. Omdat Intels geheugencontrollers als geen ander zaken als prefetching (data die in de toekomst nodig is al vooraf van het geheugen naar de processorcache laden) goed uitvoeren, heeft de geheugenbandbreedte voor de meeste applicaties weinig invloed op de prestaties. Datzelfde geldt bijvoorbeeld ook voor het verschil tussen bijvoorbeeld DDR3-1600 en DDR3-2133: leuk voor overklokkers, maar als normale gebruiker merk je er niks van.

Dan blijft er nog één ding over: Socket 2011 processors hebben een ingebouwde PCI-Express controller met meer lanes. Daardoor is het high-end platform in theorie geschikter voor het combineren van meerdere videokaarten. Maar is dat in de praktijk ook wel zo?

Nvidia GeForce GTX Titan SLI (4-way)
Voor deze test gingen we aan de slag met vier Nvidia GeForce GTX Titans, beschikbaar gesteld door Tones.be.

Lanes

Socket 1150 processors hebben, net als de Socket 1156 en 1155 voorlopers, een ingebouwde PCI-Express controller met 20 lanes, in het geval van Haswell en Ivy Bridge volgens de PCI-Express 3.0 standaard. Vier daarvan worden gebruikt voor de verbinding met de chipset, die Intel DMI (Direct Media Interface) noemt. Dat betekent dat er 16 overblijven voor het aansluiten van een videokaart.

Alle moderne videokaarten maken gebruik van een PCI-Express x16 aansluiting en dat komt dus precies overeen met het aantal beschikbare lanes: so far so good. Ga je echter twee videokaarten in SLI of Crossfire combineren op een Socket 1150 moederbord, dan moeten de 16 lanes verdeeld worden over beide kaarten, elk 8 lanes dus.

Wil je drie videokaarten plaatsen, dan moet er nog een ander trucje worden toegepast. De Z87-chip biedt immers nog eens 8 PCI-Express 2.0 lanes. Een aantal daarvan wordt vaak al op het moederbord gebruikt voor het verbinden van netwerkchips, extra SATA-controllers of PCI-Express x1 sloten. Wanneer je op een Socket 1150 bord een derde PCI-Express x16 slot vindt, is dat intern meestal voorzien van vier van de lanes vanuit de chipset. Maar waar PCI-Express 3.0 x16 een doorvoersnelheid van circa 16 GB/s biedt, heeft PCI-Express 2.0 x4 nog maar circa 2 GB/s, één achtste dus. Het moge duidelijk zijn dat dat niet optimaal is.

X79

Socket 2011 processors, zowel de bestaande Sandy Bridge-E als de nieuwe Ivy Bridge-E modellen, hebben een ingebakken PCI-Express 3.0 controller met maar liefst 40 lanes. Aangezien de verbinding tussen de processors en de X79 chipset via een andere interface loopt, QuickPath, hoeven daar niet eens lanes aan opgeofferd te worden. In de regel worden 8 van de 40 lanes gebruikt voor onboard controllerchips en PCI-Express x1 sloten. Vergeet niet dat de X79 chipset geen USB 3.0 ondersteunt en maar twee keer Serial ATA 600 biedt, dus juist bij deze borden zijn er altijd de nodig extra onboard controllerchips te vinden. Desalniettemin blijven er ook dan nog altijd 32 lanes voor videokaarten beschikbaar.

Wanneer je op een Socket 2011 moederbord dus twee videokaarten plaatst, worden deze beide met een volledige PCI-Express 3.0 x16 verbinding aangestuurd. Wanneer je drie kaarten plaatst, wordt de lanes-verdeling 16/8/8-lanes en bij vier kaarten hebben nog steeds alle kaarten 8 lanes tot hun beschikking.

Je zou dus kunnen beredeneren dat SLI of Crossfire met twee kaarten sowieso al sneller moeten werken met een Socket 2011 systeem, omdat beide kaarten het maximale aantal lanes krijgen, in tegenstelling tot 8 lanes per stuk bij Socket 1150. Maar… misschien is de 8 GB/s van PCI-Express 3.0 x8 wel meer dan genoeg?

PLX-chip

Het combineren van drie of vier videokaarten is op een Socket 1150 bord zoals gezegd eigenlijk niet mogelijk. De truc met de vier lanes vanuit de chipset wordt door AMD wel ondersteund voor CrossfireX, maar wel ernstig afgeraden. Nvidia SLI weigert bij een opstelling als deze alle dienst. Toch zijn er Socket 1150 moederborden met ondersteuning voor 3-way en 4-way SLI. Dat komt doordat fabrikanten op dergelijke borden een PCI-Express switch-chip plaatsen, in de regel een PLX PEX8747. Deze chip wordt via PCI-Express x16 verbonden met de CPU en biedt aan de andere kant 32 lanes voor de videokaarten. Hierdoor kunnen twee kaarten elk met 16 lanes of vier kaarten elk met 8 lanes worden aangestuurd.

Uiteraard blijft de totale bandbreedte richting de CPU beperkt tot de 16 GB/s van PCI-Express 3.0 x16. Doordat de PLX-chip kan schakelen, kunnen bij plaatsing van twee kaarten beide op volle snelheid communiceren, mits de ander geen dataoverdracht doet. Belangrijker: via de PLX-chip kunnen de twee kaarten ook onderling data versturen op PCI-Express x16 snelheid. Datzelfde geldt ook wanneer er drie of vier kaarten geplaatst zijn; alleen is de onderlinge communicatie uiteraard beperkt tot x8 snelheid.

Omdat de PLX-chip een schakelaar is, brengt deze enige vertraging met zich mee. Die is volgens de makers echter maximaal 100 ns en daarmee vrijwel te verwaarlozen.

Een kanttekening is dat een Z87-moederbord met PLX-chip in de regel vrijwel net zo duur is als een X79 bord. Desalniettemin biedt de oplossing in theorie dus betere 2-way SLI/Crossfire ondersteuning voor het Socket 1150 platform en daarnaast 3-way en 4-way ondersteuning. Maar werkt het zo goed als beloofd?


De PLX PEX8747 chip zoals aanwezig op verschillende high-end Z87 borden verhoogt het aantal PCI-Express lanes en maakt 3- en 4-way SLI/Crossfire mogelijk.

Test

Om de prestaties van SLI op verschillende configuraties te testen gingen we aan de slag met een viertal Nvidia GeForce GTX Titan videokaarten (de oude varianten overigens, dus niet de nog wat snellere Black varianten). Onder het motto: als we met deze bloedsnelle videokaarten geen verschil meten, zal dat met langzamere modellen zeker niet het geval zijn. Deze kaarten werden beschikbaar gesteld door de Belgische hardwareshop Tones.be, waarvoor dank!

We hebben, gebruikmakend van GeForce driver 331.40, zowel 2-way als 3-way en 4-way SLI getest op een viertal platformen. Allereerst een Core i7 4770K (topmodel quad-core Haswell Socket 1150) op een standaard Z87-moederbord (de ASUS Z87-Deluxe). In deze configuratie konden we uiteraard enkel 2-way SLI testen. Daarna draaiden we tests met dezelfde Core i7 4770K op een Z87 bord met PLX-chip (de ASUS Maximus VI Extreme). Hier testten we naast 2-way SLI ook 3-way en 4-way. Ten slotte gingen we aan de slag op een Socket 2011 bord met X79-chipset (de ASUS Rampage IV Formula), waarop we ook 2-way, 3-way en 4-way SLI testten. Dat deden we echter met twee verschillende CPU’s: de quad-core Core i7 4820K en de six-core Core i7 4960X. Op alle vier de platforms stelden we de CPU’s overigens in op 4,5 GHz, om een CPU-bottleneck zoveel mogelijk weg te nemen.

Nog even iets over die processors: de quad-core Core i7 4820K en Core i7 4770K liggen qua prijs ongeveer op hetzelfde niveau. De i7 4820K heeft het voordeel van de extra lanes en de quad-channel geheugencontroller, maar de i7 4770K kent als vertegenwoordiger van een nieuwere generatie (Haswell) wat meer interne optimalisaties. Uit onze test van de i7 4820K weten we dat de 4770K bij CPU-benchmarks in de regel een paar procent sneller en sowieso een stuk zuiniger is. De vraag is of de extra lanes van de 4820K daar bij SLI-benchmarks tegenop wegen.

De test zelf bestaat allereerst uit 3DMark11 en 3DMark Fire Strike, beide zowel in standaard als Extreme modus gedraaid. Daarnaast testten we een vijftal games: Battlefield 3, Far Cry 3, Hitman: Absolution, Crysis 3 en Metro: Last Light, alle zowel in Full HD (1920x1080) als 3x Full HD (5760x1080) resolutie op maximale kwaliteitsinstellingen.


De drie voor dit artikel gebruikte moederborden. Van links naar rechts: ASUS Z87-Deluxe (Socket 1150, Z87), ASUS Maximus VI Extreme (Socket 1150, Z87 + PLX) en ASUS Rampage IV Formula (Socket 2011, X79)

Resultaten

Alle resultaten vind je in onderstaande tabel, waaraan we drie kolommen hebben toegevoegd. In de twee na laatste kolom vind je het verschil tussen SLI op een Socket 1150 moederbord met en zonder PLX PCI-Express switch. Uiteraard kunnen we dat enkel voor 2-way SLI tonen. In de één na laatste kolom vind je het verschil tussen de Socket 2011 en Socket 1150 platforms met quad-core CPU’s en in de derde kolom het verschil tussen Socket 2011 en 1150 wanneer we op die eerste een zes-core CPU plaatsen.

Om maar bij het begin te beginnen, heeft het nut om een duurder Socket 1150 moederbord met PLX-chip te kopen wanneer je twee videokaarten wil combineren, 2-way SLI dus? Het antwoord is een overduidelijk ‘nee’. Gemiddeld biedt de switch-chip een prestatieverbetering van 0,2%, ofwel een verwaarloosbare verbetering. Bieden de echte extra lanes van het Socket 2011 platform dan voordeel bij 2-way SLI? Dat is evenmin het geval. Met twee Titans gecombineerd met een Core i7 4820K komen we zelfs gemiddeld uit op 1,8% lagere prestaties dan op een Socket 1150 bord. De extra lanes wegen dus niet op tegen de paar procent betere CPU-prestaties van de 4770K. Ook hier geldt dat het verschil verwaarloosbaar is. Heeft het voor 2-way SLI dan nut om een zes-core CPU te kopen? Ook hier moeten we ontkennend antwoorden. Twee Titans op een Core i7 4960X leveren gemiddeld nog geen 3% betere scores dan in combinatie met een Core i7 4770K. Een processor die ruwweg drie keer zo duur is, blijkt voor gamers dus een onzinnige investering.

Heeft het Socket 2011 platform met de extra lanes dan wel nut voor 3-way of 4-way SLI, of werkt een Socket 1150 setup met moederbord met PLX-switch net zo goed? Onze test wijst uit dat dat laatste zelfs beter werkt wanneer we quad-core met quad-core vergelijken. Met 3-way SLI is de configuratie met Core i7 4820K gemiddeld 4,6% langzamer dan het systeem met Core i7 4770K. Met 4-way SLI zien we een vergelijkbaar resultaat. De keuze voor een zes-core CPU zorgt er wel voor dat het Socket 2011 platform sneller is, maar het voordeel van 3,1% hogere prestaties bij 4-way SLI is wat ons betreft verwaarloosbaar.

Systeemi7 4770K
@ 4.5 GHz
Socket 1150
Intel Z87
i7 4770K
@ 4.5 GHz
Socket 1150
Intel Z87
+ PEX8747
i7 4820K
@ 4.5 GHz
Socket 2011
Intel X79
i7 4960X
@ 4.5 GHz
Socket 2011
Intel X79
Z87 + PEX
vs.
Z87
i7 4820K
vs.
i7 4770K
+ PEX
i7 4960X
vs.
i7 4770K
+ PEX
2-way SLI (2x GeForce GTX Titan)       
3DMark11 Performance 20077 20179 20118 22292 0,5% -0,3% 10,5%
3DMark11 Extreme 9045 9280 9105 9262 2,6% -1,9% -0,2%
3DMark Fire Strike 14794 14734 14516 15278 -0,4% -1,5% 3,7%
3DMark Fire Strike Extreme 7934 7968 7858 8102 0,4% -1,4% 1,7%
Battlefield 3 - 1920x1080 - Ultra - DoF 90 173,7 fps 173,1 fps 157,4 fps 172,4 fps -0,3% -9,1% -0,4%
Battlefield 3 - 5760x1080 - Ultra - DoF 90 71,2 fps 73,2 fps 71,0 fps 70,3 fps 2,8% -3,0% -4,0%
Far Cry 3 - 1920x1080 - Ultra 87,7 fps 90,0 fps 87,1 fps 87,7 fps 2,6% -3,2% -2,6%
Far Cry 3 - 5760x1080 - Ultra 47,3 fps 47,4 fps 47,4 fps 50,0 fps 0,2% 0,0% 5,5%
Hitman: Absolution - 1920x1080 - Ultra 71,0 fps 68,7 fps 67,7 fps 76,4 fps -3,2% -1,5% 11,2%
Hitman: Absolution - 5760x1080 - Ultra 54,0 fps 52,8 fps 52,3 fps 54,9 fps -2,2% -0,9% 4,0%
Crysis 3 - 1920x1080 - Very High 70,5 fps 70,6 fps 64,3 fps 73,5 fps 0,1% -8,9% 4,1%
Crysis 3 - 5760x1080 - Very High 31,6 fps 31,8 fps 32,7 fps 32,9 fps 0,6% 2,8% 3,5%
Metro Last Light - 1920x1080 - High 94,0 fps 93,0 fps 91,0 fps 94,0 fps -1,1% -2,2% 1,1%
Metro Last Light - 5760x1080 - High 48,0 fps 48,0 fps 48,0 fps 48,0 fps 0,0% 0,0% 0,0%
Gemiddelde - - - - 0,2% -2,2% 2,7%
3-way SLI (3x GeForce GTX Titan)       
3DMark11 Performance - 23996 22550 26409 - -6,0% 10,1%
3DMark11 Extreme - 12777 11804 12968 - -7,6% 1,5%
3DMark Fire Strike - 18687 17454 20048 - -6,6% 7,3%
3DMark Fire Strike Extreme - 10466 10180 10631 - -2,7% 1,6%
Battlefield 3 - 1920x1080 - Ultra - DoF 90 - 187,1 fps 172,5 fps 180,3 fps - -7,8% -3,6%
Battlefield 3 - 5760x1080 - Ultra - DoF 90 - 100,3 fps 98,5 fps 95,9 fps - -1,8% -4,4%
Far Cry 3 - 1920x1080 - Ultra - 89,9 fps 84,4 fps 87,3 fps - -6,1% -2,9%
Far Cry 3 - 5760x1080 - Ultra - 66,1 fps 63,7 fps 65,2 fps - -3,6% -1,4%
Hitman: Absolution - 1920x1080 - Ultra - 70,9 fps 66,6 fps 76,2 fps - -6,1% 7,5%
Hitman: Absolution - 5760x1080 - Ultra - 53,2 fps 50,7 fps 56,6 fps - -4,7% 6,4%
Crysis 3 - 1920x1080 - Very High - 68,1 fps 63,9 fps 71,3 fps - -6,2% 4,7%
Crysis 3 - 5760x1080 - Very High - 46,1 fps 44,6 fps 44,6 fps - -3,3% -3,3%
Metro Last Light - 1920x1080 - High - 83,0 fps 83,0 fps 85,0 fps - 0,0% 2,4%
Metro Last Light - 5760x1080 - High - 48,0 fps 47,0 fps 47,0 fps - -2,1% -2,1%
Gemiddelde - - - - - -4,6% 1,7%
4-way SLI (4x GeForce GTX Titan)       
3DMark11 Performance - 25920 24617 29798 - -5,0% 15,0%
3DMark11 Extreme - 15183 14534 15560 - -4,3% 2,5%
3DMark Fire Strike - 20992 19566 22772 - -6,8% 8,5%
3DMark Fire Strike Extreme - 12516 11335 12864 - -9,4% 2,8%
Battlefield 3 - 1920x1080 - Ultra - DoF 90 - 183,5 fps 167,3 fps 180,1 fps - -8,8% -1,9%
Battlefield 3 - 5760x1080 - Ultra - DoF 90 - 125,2 fps 117,4 fps 125,6 fps - -6,2% 0,3%
Far Cry 3 - 1920x1080 - Ultra - 88,7 fps 83,8 fps 86,7 fps - -5,5% -2,3%
Far Cry 3 - 5760x1080 - Ultra - 65,0 fps 60,3 fps 59,3 fps - -7,2% -8,8%
Hitman: Absolution - 1920x1080 - Ultra - 70,3 fps 65,4 fps 74,2 fps - -7,0% 5,5%
Hitman: Absolution - 5760x1080 - Ultra - 51,5 fps 49,6 fps 56,1 fps - -3,7% 8,9%
Crysis 3 - 1920x1080 - Very High - 67,7 fps 62,5 fps 69,9 fps - -7,7% 3,2%
Crysis 3 - 5760x1080 - Very High - 55,7 fps 56,7 fps 59,8 fps - 1,8% 7,4%
Metro Last Light - 1920x1080 - High - 83,0 fps 83,0 fps 83,0 fps - 0,0% 0,0%
Metro Last Light - 5760x1080 - High - 43,0 fps 43,0 fps 44,0 fps - 0,0% 2,3%
Gemiddelde - - - - - -5,0% 3,1%

Conclusie

Dat het maximale aantal van zes cores en de quad-channel geheugencontroller van Socket 2011 processors bij games op wellicht een enkele uitzondering na geen voordeel biedt, hadden we eerder al eens bewezen. Het theoretische voordeel dat Socket 2011 heeft bij SLI/Crossfire configuraties dankzij de extra lanes, blijkt op basis van onze test in de praktijk niet te bestaan, noch voor 2-way SLI noch wanneer je drie of meer kaarten combineert. Voor 2-way SLI laat een standaard Socket 1150 bord niets liggen ten opzichte van een duurdere oplossing. Voor 3-way en 4-way SLI is een Socket 1150 bord met PCI-Express switch net zo goed als een Socket 2011 platform. Daarnaast bewijst onze test nogmaals dat zes cores voor games vooralsnog niet voor hogere prestaties zorgen. Doe er je voordeel mee!

0
*