'Sprong in efficiëntie Maxwell kwam door implementatie tile-based rendering'

36 reacties

De laatste paar jaar zijn er verschillende generaties GPU's voorbijgekomen van AMD en Nvidia. Onder andere met Maxwell maakte Nvidia een behoorlijke stap in efficiëntie, terwijl het productieprocedé gelijk bleef. De oorzaak van deze verbeteringen blijft grotendeels het geheim van de chef - van Nvidia. Toch is David Kanter van Real World Technologies een nieuwe techniek voor desktop-graphics op het spoor gekomen die Nvidia in Pascal en Maxwell gebruikt om de efficiëntie op te krikken.

Het verschil met voorgaande generaties is de manier waarop beelden gerenderd worden. Traditioneel gebeurt dit op de PC heel simpel. De data die berekent moet worden gaat in een keer naar de GPU, waarna de GPU zo snel mogelijk alles probeert te renderen en een frame naar het werkgeheugen verplaatst. Dit heet immediate mode rendering.

Nvidia gebruikt in de laatste twee generaties het zogenaamde tile-based rendering. Zoals de naam doet vermoeden wordt er gebruik gemaakt van tiles, want het beeld dat gerenderd moet worden, wordt opgedeeld in meerdere compartimenten die afzonderlijk gerenderd worden. De berekende beelddelen komen samen in het cache en worden vervolgens gecombineerd tot een volledige frame. Een extra stap, maar met meer controle en meer efficiëntie.

Het voordeel van tile-based rendering is namelijk dat de benodigde geheugenbandbreedte kleiner is dan wanneer een beeld in een keer berekend wordt. Hierdoor is het verbruik van de GPU een stuk kleiner. Voor meer controle en efficiëntie regelt de GPU tevens de grootte van de afzonderlijke beelddelen (tiles) en kan de GPU zo dus in feite zelf de beste verhouding vinden tussen belasting van verschillende delen van de GPU. Bij Maxwell en Pascal wordt eigenlijk dus gebruik gemaakt van een soort load-balancing voor de aparte delen in de GPU en daardoor zijn deze generaties efficiënter. Hieronder een video van David Kanter waarin alles meer gedetailleerd uitgelegd wordt.

Bron: Real World Technologies


Besproken producten

Vergelijk alle producten

Vergelijk  

Product

Prijs

Nvidia GeForce GTX 950

Nvidia GeForce GTX 950

  • GM206
  • 768 cores
  • 1024 MHz
  • 2048 MB
  • 128 bit
  • DirectX 12 fl 12_1
  • PCI-Express 3.0 x16
Niet verkrijgbaar
Nvidia GeForce GTX 950 Low Power

Nvidia GeForce GTX 950 Low Power

  • GM206
  • 768 cores
  • 1024 MHz
  • 2048 MB
  • 128 bit
  • DirectX 12 fl 12_1
  • PCI-Express 3.0 x16
Niet verkrijgbaar
Nvidia GeForce GTX 960 2GB

Nvidia GeForce GTX 960 2GB

  • GM206
  • 1024 cores
  • 1126 MHz
  • 2048 MB
  • 128 bit
  • DirectX 12 fl 12_1
  • PCI-Express 3.0 x16
Niet verkrijgbaar
Nvidia GeForce GTX 960 4GB

Nvidia GeForce GTX 960 4GB

  • GM206
  • 1024 cores
  • 1126 MHz
  • 4096 MB
  • 128 bit
  • DirectX 12 fl 12_1
  • PCI-Express 3.0 x16
Niet verkrijgbaar
Nvidia GeForce GTX 970

Nvidia GeForce GTX 970

  • GM204
  • 1664 cores
  • 1050 MHz
  • 4096 MB
  • 256 bit
  • DirectX 12 fl 12_1
  • PCI-Express 3.0 x16
Niet verkrijgbaar
Nvidia GeForce GTX 980

Nvidia GeForce GTX 980

  • GM204
  • 2048 cores
  • 1127 MHz
  • 4096 MB
  • 256 bit
  • DirectX 12 fl 12_1
  • PCI-Express 3.0 x16
Niet verkrijgbaar
Nvidia GeForce GTX 980 Ti

Nvidia GeForce GTX 980 Ti

  • GM200
  • 2816 cores
  • 1000 MHz
  • 6144 MB
  • 384 bit
  • DirectX 12 fl 12_1
  • PCI-Express 3.0 x16
Niet verkrijgbaar
Nvidia GeForce GTX 1060 6GB

Nvidia GeForce GTX 1060 6GB

  • GP106
  • 1280 cores
  • 1506 MHz
  • 6144 MB
  • 192 bit
  • DirectX 12 fl 12_1
  • PCI-Express 3.0 x16
Niet verkrijgbaar
Nvidia GeForce GTX 1070

Nvidia GeForce GTX 1070

  • GP104
  • 1920 cores
  • 1506 MHz
  • 8192 MB
  • 256 bit
  • DirectX 12 fl 12_1
  • PCI-Express 3.0 x16
Niet verkrijgbaar
Nvidia GeForce GTX 1080

Nvidia GeForce GTX 1080

  • GP104
  • 2560 cores
  • 1607 MHz
  • 8192 MB
  • 256 bit
  • DirectX 12 fl 12_1
  • PCI-Express 3.0 x16
Niet verkrijgbaar
« Vorig bericht Volgend bericht »
0
*