Hawaii chip
Kloppend hart van de nieuwe kaarten van AMD is een gloednieuwe GPU met codenaam Hawaii. Deze chip is AMD's nieuwe topmodel, groter en sneller dan Tahiti, de chip die we kennen van de Radeon HD 7900 reeks en de nieuwe Radeon R9 280X. Net als Tahiti wordt Hawaii geproduceerd middels 28nm transistors. Het maakt dat AMD voor deze nieuwe generatie dus niet het voordeel heeft van kleinere transistors om meer functionaliteit en betere prestaties te bieden. Uiteraard is de nieuwe chip op menig front slimmer en efficiënter ontworpen dan z'n voorloper, maar hij is bovenal ook groter. Ter vergelijking: Tahiti bevat circa 4,3 miljard transistors en is 352 mm² groot, Hawaii heeft circa 6,2 miljard transistors en meet 438 mm². Dat is overigens nog altijd significant minder dan de Nvidia GK110 GPU die we kennen van de GeForce GTX 780 Ultra en GTX Titan kaarten; deze bevat 7,1 miljard transistors en meet 551 mm².
In de basis is Hawaii gebaseerd op dezelfde architectuur als Tahiti en alle andere chips uit de Radeon HD 7000 reeks: AMD heeft dus opnieuw haar Graphics Core Next architectuur toegepast. Het feit dat alle courante AMD GPU's in de basis op dezelfde manier hun werk uitvoeren, bood AMD de mogelijkheid om de nieuwe Mantle low-level API te ontwikkelen, waarover verderop meer. Overigens, om dezelfde reden verwachten we niet dat AMD de komende maanden met driver optimalisaties net zulke prestatiewinsten weet te boeken als de eerste zes maanden na introductie van de Radeon HD 7970. Vergeet niet; toen was GCN nieuw en een radicaal andere opbouw dan de VLIW5- en VLIW4-architectuur van voorgaande Radeon-chips, waardoor er dus nog veel werk aan de winkel was voor optimalisaties op driverniveau. De nieuwe chip profiteert daarentegen direct van alle optimalisaties die de afgelopen twee jaar al zijn gedaan.
Ten opzichte van Tahiti is Hawaii wat oneerbiedig gezegd vooral van alles meer. Meer rekeneenheden, meer cache-geheugen, meer geheugencontroller segmenten en meer render backends. Wat onaangepast is gebleven ten opzichte van de vorige generatie is de UVD videodecoder (inclusief alle post-processing technologie) en de VCE H.264 video-encoder. Nieuw in de chip zijn de TrueAudio DSP's en de nieuwe Crossfire functionaliteit, waarover verderop meer.
Net als alle bestaande GPU's uit de Radeon HD 7000 reeks is Hawaii opgebouwd uit zogenaamde GCN Compute Units, basisblokken met 64 shader units, onderverdeeld in vier SIMD (Single Instruction Multiple Data) blokken waarbij iedere execution unit op ieder moment dezelfde opdracht kan uitvoeren op basis van andere data. Iedere compute unit bevat een eigen scheduler, een viertal texture units, 64 kB lokaal cachegeheugen dat door shader algoritmes gebruik kan worden, 256 kB aan registers voor vectorberekeningen, 4 kB aan registers voor scalar-berekeningen en 16 kB aan L1-cache dat als poort dient richting het RAM-geheugen.
De GCN Compute Units zitten per elf stuks gecombineerd in Shader Engines, waarvan er uiteindelijk vier stuks in de chip zitten. Iedere shader engine bevat een geometry processor, die berekeningen aan primitieven (driehoeken) uitvoert, voordat deze gerasterizeerd naar pixels worden. Verder heeft iedere shader engine tot vier render backends, waar de uiteindelijke data voor pixels zoals deze op het scherm terechtkomen wordt verzameld. Juist omdat er (eindelijk) een trend is in de richting van schermen met een hogere resolutie (WQHD, 4K, ...) is juist het totaal aantal render backends flink vergroot; daar lag bij bestaande kaarten volgens AMD een duidelijke bottleneck wanneer gebruikt bij 4K-resolutie.
Met vier shader engines met elk elf GCN compute units die elk weer uit 64 shader units bestaan, komen we in totaal op 4 x 11 x 64 = 2816 execution units. Bij de Radeon R9 290 zijn 10 in plaats van 11 compute units per shader engine actief, waardoor we uitkomen op 4 x 10 x 64 = 2560 shader units. Ter vergelijking: de Tahiti chip van de Radeon HD 7970 en R9 280X bevat 2048 execution units. Op dit vlak is er dus een stijging van 37,5%.
Juist het aantal render backends is zoals geschreven dus flink verhoogd. In Tahiti vonden we 32 ROP's, bij Hawaii zijn er dat 64. Dat betekent dus een verdubbeling van de potentiële pixel fillrate wanneer de klokfrequenties van de GPU's gelijk zijn.
Een andere belangrijke aanpassing is dus de geheugencontroller. Bij Tahiti bestond die uit een zestal 64-bit segmenten, 384-bit in totaal dus. Bij Hawaii heeft AMD gekozen voor een 512-bit ontwerp met een achttal segmenten. Over het algemeen is de beslissing voor een dergelijke brede geheugenbus niet triviaal; chips worden er groter van, krijgen meer pinnen en ook het PCB-ontwerp van kaarten wordt complexer en duurder. AMD geeft echter aan dat de bredere geheugenbus de chip zelf niet groter heeft gemaakt: de geheugencontroller is opnieuw ontworpen, waardoor de 512-bit controller nu fysiek 20% minder plek inneemt dan de 384-bit controller van Tahiti. Men spreekt zodoende over een toename aan bandbreedte van 50% per mm². Dat is een leuke claim, maar de vraag die bij ons opkomt is of de geheugencontroller überhaupt wel op dezelfde klokfrequenties kán werken als zijn voorloper. De voortekenen daarvoor zijn niet goed; waar 1500 MHz gebruikelijk was bij Radeon HD 7970 kaarten, werkt het geheugen bij de R9 290X op 1250 MHz. Daarmee wordt een groot gedeelte van het voordeel van de bredere bus weer teniet gedaan. Het zorgt er wel voor dat AMD's partners goedkopere GDDR5-chips kunnen gebruiken, waardoor goedkopere kaarten met 4GB in de markt kunnen worden gezet. Grote kans dat dat laatste een belangrijke afweging was.
We schreven al dat het aantal shader units met 37,5% is toegenomen ten opzichte van de Tahiti chip. Aangezien de AMD Radeon R9 290X standaard op een iets lagere klokfrequentie werkt dan de Radeon HD 7970 GHz Edition (maximaal 1 GHz in plaats van maximaal 1050 MHz), is theoretische rekenkracht daardoor circa 30% toegenomen, van 4,3 Teraflops naar 5,6 Teraflops. Als we in AMD's onderstaande lijstje van "achievements" kijken, zien we dat voornamelijk de geometry processor en pixel fill rate eruit springen. Beide zijn binnen de chip verdubbeld, maar komen vanwege de lagere klokfrequentie uit op 1,9x verbetering. Nogmaals; de hogere pixel fill rate kan voornamelijk een belangrijke rol spelen bij betere prestaties op hoge resoluties.
10 besproken producten
Vergelijk | Product | Prijs | |
---|---|---|---|
![]() |
AMD Radeon R9 290X (Quiet Mode)
|
Niet verkrijgbaar | |
![]() |
AMD Radeon R9 290X (Uber Mode)
|
Niet verkrijgbaar | |
![]() |
Asus Radeon R9 290X BF4 Edition 4GB
|
Niet verkrijgbaar | |
![]() |
Club 3D Radeon R9 290X 4GB
|
Niet verkrijgbaar | |
![]() |
Club 3D Radeon R9 290X BF4 Edition 4GB
|
Niet verkrijgbaar | |
![]() |
HIS Radeon R9 290X 4GB
|
Niet verkrijgbaar | |
![]() |
MSI Radeon R9 290X 4GB
|
Niet verkrijgbaar | |
![]() |
PowerColor Radeon R9 290X 4GB
|
Niet verkrijgbaar | |
![]() |
Sapphire Radeon R9 290X 4GB
|
Niet verkrijgbaar | |
![]() |
VTX3D Radeon R9 290X 4GB
|
Niet verkrijgbaar |