AMD Radeon RX Vega 56 / 64 review: minder euro's, meer watts

224 reacties
3 besproken producten
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Scherp geprijsd, (bijna) niet te koop
  3. 3. Referentiekaart
  4. 4. Vega 10 GPU
  5. 5. High Bandwidth Cache (of toch Memory?)
  6. 6. Display engine en mediamogelijkheden
  7. 7. Benchmarks: nieuwe testprocedure
  8. 8. Benchmarks: 3DMark Fire Strike / Timespy
  9. 9. Benchmarks: Unigine Superposition
  10. 10. Benchmarks: Ghost Recon: Wildlands (DX11)
  11. 11. Benchmarks: GTA V (DX11)
  12. 12. Benchmarks: Project Cars (DX11)
  13. 13. Benchmarks: Rainbow Six Siege (DX11)
  14. 14. Benchmarks: The Witcher 3 (DX11)
  15. 15. Benchmarks: Battlefield 1 (DX12)
  16. 16. Benchmarks: Hitman (DX12)
  17. 17. Benchmarks: Rise of the Tomb Raider (DX12)
  18. 18. Benchmarks: Total War: Warhammer (DX12)
  19. 19. Benchmarks: Doom (Vulkan)
  20. 20. Benchmarks: Hardware.Info GPU Prestatiescore 2017-2018
  21. 21. Testresultaten: Stroomverbruik
  22. 22. Testresultaten: Geluidsproductie
  23. 23. Testresultaten: AMD Radeon RX Vega voor coin mining
  24. 24. Testresultaten: Overklokken
  25. 25. Conclusie
  26. 3 besproken producten
  27. 224 reacties

Vega 10 GPU

Het kloppend hart van de nieuwe Vega RX videokaarten is natuurlijk de Vega 10 GPU. Deze wordt net als de Polaris GPU van de Radeon RX 480/580 kaarten geproduceerd middels een 14nm FinFET procedé, maar met 12,5 miljard transistors is Vega 10 een stuk groter dan Polaris.


Boven: De Vega 10 GPU met twee HBM2 stacks. Onder: de Fiji GPU met vier HBM1 stacks.

Waar de Polaris 20 chip 2304 grafische cores heeft, heeft Vega 10 er aanzienlijk meer, 4096 om precies te zijn. Dat is weliswaar hetzelfde aantal waar de Fiji chip van de Radeon Fury (X) videokaarten de beschikking over had, maar de Vega chip is gebaseerd op een nieuwe, geoptimaliseerde architectuur. Bovendien is Vega geschikt om op veel hogere klokfrequenties te werken dan Fiji.

De 4096 shader processors van de Vega 10 chip zijn onderverdeeld in 64 zogenaamde next-gen­ compute units. De GPU bevat verder 4 next-gen geometry engines, 256 texture units en 64 render backends. Er is 4 MB L2-cache binnen de GPU - een verdubbeling ten opzichte van de Polaris generatie - maar wanneer je alle in de chips aanwezige registers en caches bij elkaar optelt kom je volgens AMD zelfs uit op 45 MB aan SRAM-cellen. De belangrijkste eigenschap van de nieuwe GPU is echter de geïntegreerde geheugencontroller. Vega 10 wordt niet gecombineerd met conventioneel GDDR5(X) geheugen, maar met HBM2, waarover meer op de volgende pagina.

Vega 10 is de eerste discrete AMD GPU die gebruik maakt van Infinity Fabric, AMD’s nieuwe gestandaardiseerde technologie om verschillende onderdelen van een chip met elkaar te laten communiceren. De Ryzen CPU’s maken ook gebruik van dit Infinity Fabric. Doordat er nu een gestandaardiseerde interne communicatiemethode is voor alle soorten chiponderdelen, kan AMD in de toekomst veel sneller nieuwe chips ontwikkelen. Zodra over een tijdje Ryzen APU’s op de markt komen (met een Vega-variant GPU aan boord) zullen ook daar CPU en GPU via Infinity Fabric met elkaar communiceren.

Hogere klokfrequenties

Wat bij de specificaties van de Radeon RX Vega kaarten direct zal opvallen is dat de GPU’s op relatief hoge klokfrequenties werken. Waar bij de Fiji-chip ca. 1 GHz nog standaard was en Polaris kaarten rond de 1,3 GHz hun werk moeten doen, werken de Vega chips op 1,5 tot zelfs 1,7 GHz.

Om dat mogelijk te maken is de gehele opbouw van de GPU volgens AMD herzien. Men is na Polaris duidelijk gaan onderzoeken waar de bottlenecks in het ontwerp zaten en op basis daarvan zijn verschillende onderdelen van de GPU-architectuur opnieuw ontworpen. Belangrijk is dat men deze aanzienlijke stap in klokfrequentie heeft kunnen zetten zonder de pipeline van de grafische cores te verlengen; de pipeline voor zowel integer als floating point berekening was vier stappen bij Polaris en dat is ook bij Vega nog steeds het geval. Dit zorgt ervoor dat de hogere klokfrequentie direct bijdraagt aan hogere prestaties.

Nieuwe architectuur

De architectuur van Vega is geheel nieuw en Vega 10 is dus zeer zeker niet “Polaris met meer rekeneenheden en HBM-geheugen”. Over wat er allemaal nieuw is binnen de Vega-architectuur had AMD overigens eind vorig jaar al veel bekend gemaakt (zie ook dit artikel).

Allereerst heeft AMD binnen de Vega-architectuur een nieuwe, volledig programmeerbare geometrie pipeline ontwikkeld, getiteld primitive shader. In de traditionele 3D-pipeline komt deze in plaats van de vertex en geometry shaders en pakt dus al het werk op dat te maken heeft met het uit driehoeken opbouwen van de scene. Bij bestaande software kan Vega ook prima conventionele code vertex en geometery shader code verwerken, maar dankzij uitbreidingen op de Vulkan en wellicht in de toekomst ook DirectX API's zijn de compute units ook efficiënter volgens de nieuwe methode aan te sturen. Laat duidelijk zijn; het gaat nog altijd gewoon om de bestaande rekeneenheden (compute units) die op meerdere manieren aangestuurd kunnen worden, maar dankzij de nieuwe methode is er wat minder overhead en kan er efficiënter gewerkt worden. 

De compute units, de feitelijke rekeneenheden waarvan er duizenden binnen de chip aanwezig zijn, zijn ook vernieuwd en noemt men nu Vega NCU, waarbij NCU staat voor Next-generation Compute Unit. Een belangrijke verbetering is dat de CU's niet enkel geoptimaliseerd zijn voor verwerking van 32-bit data, maar nu ook op dubbele snelheid 16-bit data en ook op viervoudige snelheid 8-bit data kunnen verwerken. Deze aanpassing is vooral van belang om de GPU's geschikter te maken voor compute workloads, zoals bijvoorbeeld machine learning. Volgens AMD kunnen ook gamers er in potentie van profiteren. Sommige niet graphics-gerelateerde code van game-engines, zoals bijvoorbeeld AI (artificiële intelligentie) algoritmes, zouden ook in 16-bit of 8-bit uitgevoerd kunnen worden en daarvoor veel sneller verwerkt worden. Tijdens de presentatie toonde AMD als voorbeeld de nieuwe 3DMark Serra benchmark waarbij bij Vega een aantal post-processing en andere effecten in 16-bit kunnen worden doorgerekend, zonder dat dit zichtbare visuele implicaties heeft. Het resultaat is een double digit verbetering van de prestaties.

Ook de manier waarop de Vega chips de uiteindelijke pixels berekenen is geoptimaliseerd. Verbeterde algoritmes bepalen vooraf of een pixel wel of niet zichtbaar is en zetten de verdere verwerking ervan stop wanneer dat niet het geval is. Deze moeten het onnodig meerdere keren renderen van pixels binnen een frame zo veel mogelijk voorkomen.

Daarnaast nieuw is de Draw Stream Binning Rasterizer, een technologie vergelijkbaar met Tiled Based Rendering, waarbij het beeld wordt opgedeeld in vakjes (bins in AMD jargon) en vakje-voor-vakje verwerkt wordt. Hierdoor is er minder geheugenbandbreedte nodig en kunnen de prestaties omhoog. Nvidia gaf een tijd geleden toe dat een vergelijkbare technologie één van de redenen is van de goede prestaties van de GeForce 10-serie. De Draw Stream Binning Rasterizer is volgens AMD volledig beschikbaar en de drivers bepalen per game of de technologie wel of niet wordt ingeschakeld, omdat het bij sommige games voor prestatiewinst zorgt, maar bij andere niet. Dat in- en uitschakelen van DSBR gebeurt geheel automatisch op driver-niveau. Hierdoor heb je er als gebruiker geen omkijken naar, maar ook geen inzicht in. 

Ten slotte: de render backends staan in de nieuwe architectuur in directe verbinding met de L2-cache en kunnen daar op hoge snelheid mee communiceren. Dit heeft volgens AMD een significant positief effect op de prestaties bij game-engines die van deferred rendering gebruik maken.

“Meest complete DirectX 12 implementatie”

De compute units binnen Vega ondersteunen verder een 40-tal nieuwe instructies, die beschikbaar zullen komen via uitbreidingen op de Vulkan-standaard en binnen DirectX 12 zodra de Shader Model 6 standaard in een toekomstige Microsoft-update wordt gelanceerd. Een aantal van deze instructies zijn primair voor andersoortige workloads bedoeld, maar verschillende zijn ook interessant voor game developers.

Hoe dan ook stelt AMD met Vega de meest complete DirectX 12 implementatie te hebben, inclusief volledige ondersteuning voor het toekomstige Shader Model 6. Wat de meerwaarde daarvan op termijn is, zal moeten blijken. 


3 besproken producten

Vergelijk alle producten

Vergelijk   Product Prijs
AMD Radeon RX Vega 56

AMD Radeon RX Vega 56

  • Vega 10
  • 3584 cores
  • 1156 MHz
  • 8192 MB
  • 2048 bit
  • DirectX 12 fl 12_1
  • PCI-Express 3.0 x16
Niet verkrijgbaar
AMD Radeon RX Vega 64

AMD Radeon RX Vega 64

  • Vega 10
  • 4096 cores
  • 1247 MHz
  • 8192 MB
  • 2048 bit
  • DirectX 12 fl 12_1
  • PCI-Express 3.0 x16
Niet verkrijgbaar
AMD Radeon RX Vega 64 Liquid Cooled

AMD Radeon RX Vega 64 Liquid Cooled

  • Vega 10
  • 4096 cores
  • 1406 MHz
  • 8192 MB
  • 2048 bit
  • DirectX 12 fl 12_1
  • PCI-Express 3.0 x16
Niet verkrijgbaar
0
*