De nieuwe Nvidia videokaarten zoals de GTX 670, 680 en 690 zijn gebaseerd op de GK104 GPU, een chip die eigenlijk niet ontworpen is voor het topsegment. Volgens de geruchtenmolen was die rol weggelegd voor de GK110, een veel grotere en complexere chip op het 28nm productieproces. Deze chip zou eigenlijk al eerder beschikbaar moeten zijn, maar vermoedelijk nam de ontwikkeling en productie ervan meer tijd in beslag dan eerst werd gedacht. Om een antwoord te hebben op AMD's Radeon HD 7900 reeks kwam Nvidia sneller dan gepland met de GK104 GPU op de proppen, die zich overigens prima staande kan houden tegen de high-end Tahiti chip van AMD.
Maar de titel van allersnelste GPU ter wereld zal uiteindelijk toegeschreven worden aan de GK110, want deze GPU gaat er binnenkort daadwerkelijk komen. Gisteren werden de belangrijkste eigenschappen van deze nieuwe chip bekend, die met ongeveer 7,1 miljard transistors ongeveer dubbel zo groot zal zijn als de bestaande GK104 GPU die we kennen van de GTX 680. De exacte oppervlakte van dit rekenmonster werd niet genoemd, maar bij PCPer schat men deze op ongeveer 550 mm². Daarmee is de GK110 weer een traditionele reusachtige Nvidia GPU die past in het rijtje van de G80, GT200 en GF100.
2880 shader units en 384-bits geheugencontroller
Nvida noemt deze GK110 GPU de meest complexe videochip alles tijden. Er zitten in totaal 15 zogeheten SMX clustersin, die elk 192 stream processors aan boord hebben. Daarmee komt het totaal van de complete GPU op 2880 rekenkernen, die gezamenlijk goed zouden zijn voor meer dan 1 TFlop aan double-precision rekenkracht. Naar verwachting zullen de videokaarten die uiteindelijk op de markt komen één of twee clusters minder hebben, wat omgerekend 2498 of 2688 shaderunits oplevert. Verder treffen we in totaal zes 64-bits geheugencontrollers aan, zodat het geheugen via een 384-bits interface aangesproken kan worden. Details over hoeveelheid geheugen en de snelheid daarvan zijn nog niet verstrekt, maar het ligt in lijn der verwachting dat Nvidia 3 of 6 GB aan GDDR5-chips op deze videokaarten zal plaatsen.
Nvidia GK110
Slimmere GPU
De GK110 heeft, net als de GK104 die eerder gelanceerd werd, onder meer grotere registers en een ruimer cachegeheugen aan boord ten opzichte van de Fermi generatie. Andere nieuwe technieken in de Kepler GPU zijn ook gericht op het verbeteren van de GPGPU prestaties. Een voorbeeld daarvan is 'Dynamic Parallelism', een technologie waarmee de GPU ook zelf nieuwe workloads kan genereren en inladen, waardoor het de processor minder belast. Ook zorgt deze feature ervoor dat de GPU zelf prioriteiten kan geven aan bepaalde rekentaken en zelf de wachtrij van nieuwe taken kan hergroeperen. Deze techniek zal, mits de software-ontwikkelaar er goed gebruik van maakt, zorgen voor een hogere efficientie en een lagere processorbelasting.
Andere features van de GK110 zijn een beter geheugenmanagement (dat minder vertraging geeft in combinatie met ECC geheugen), Hyper-Q (een verbeterde 'hardware managed CUDA Work Distributor' die meer threads tegelijkertijd kan verwerken ten opzichte van de vorige generatie Fermi GPU's en daarmee beter de rekenkracht van alle shaderunits kan benutten) en GPU Direct (waarmee de GPU rechtstreeks een netwerkkaart of SSD kan aanspreken zonder tussenkomst van de CPU). Deze technologie moet de efficiëntie van het systeem verhogen, omdat het de processor minder zwaar belast en omdat het ook nog eens sneller werkt.
Conclusie
Al met al is de GK110 een bijzonder krachtige GPU, die vooral in GPGPU toepassingen zijn spierballen kan laten zien. Nvidia heeft vooralsnog geen plannen om een GeForce kaart met deze chip naar de consumentenmarkt te brengen. In plaats daarvan focust het zich op de professionele markt, waar deze GPU in een Tesla K20 videokaart geplaatst zal worden. Naast de K20 komt Nvidia ook met een Tesla K10 kaart op de markt, die beschikt over een tweetal kleinere GK104 GPU's. Beide kaarten zullen een TDP hebben van tegen de 300 watt. De K10 moet per direct beschikbaar zijn, deze K20 op basis van de GK110 komt wat later.
De nieuwe Tesla K20 GPGPU kaart, afbeeldingen via XbitLabs