Intels 4e generatie Core preview: "Haswell" komt eraan!

39 reacties
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Haswell
  3. 3. Krachtigere cores
  4. 4. AVX2
  5. 5. Transactional memory
  6. 6. Verbeterde graphics
  7. 7. Power management
  8. 8. Haswell voor desktops
  9. 9. Haswell voor laptops, Ultrabooks en tablets
  10. 10. 8-serie chipsets
  11. 11. Haswell-E(P) en verder
  12. 12. Verwachtingen en conclusie
  13. 39 reacties

Krachtigere cores

De afzonderlijke cores binnen Haswell zijn volgens Intel alle een stuk sneller dan de cores van Ivy Bridge en Sandy Bridge processors. Dat heeft verschillende redenen. Zo heeft Intel bijvoorbeeld de branch prediction, het inschatten welke vertakkingen in programmacode worden genomen, opnieuw verbeterd zodat de kans op achteraf zinloos werk uitvoeren is verkleind. Verder heeft Intel vrijwel alle buffers binnen de cores vergroot. De belangrijkste reden waarom Haswell cores echter sneller zullen zijn dan die van Sandy Bridge en Ivy Bridge is dat Intel het aantal execution units, de daadwerkelijke rekeneenheden binnen de cores, heeft verhoogd van zes naar acht. 

 

De eerste van de twee nieuwe execution units is geschikt om berekeningen met gehele (integer) getallen uit voeren. Daarmee komt het aantal execution units met integer ALU's op vier. De tweede nieuwe execution unit is juist bestemd om geheugenadressen te verwerken en ontlast daarmee twee andere execution units.

Bestaande execution units hebben verder extra functies gekregen. Zo kunnen de eerste twee nu ook overweg met zogenaamde FMA-instructies (waarover verderop meer). Bovendien kunnen deze eerste twee execution units nu beide floating point multiply instructies uitvoeren, ofwel floating point getallen vermenigvuldigen. Bij Sandy en Ivy Bridge kon alleen de eerste execution unit dat.

Het vergroten van het aantal execution units betekent simpelweg dat de processor meer afgeronde instructies per klokslag kan afleveren. In het theoretische geval dat er voor alle executions units op ieder moment taken zijn, zou Haswell hierdoor 33% méér instructies kunnen afleveren dan Ivy Bridge. In de praktijk komt het zelden voor dat alle executions units tegelijkertijd gebruikt worden en de te verwachten prestatiewinst zal daar dan ook een stuk lager uitvallen. Juist het feit dat de nieuwe executions units enkele bestaande aflossen en bestaande execution units meer functies hebben gekregen, maakt de kans dat alle rekeneenheden op een bepaald moment ingezet kunnen worden wel groter. Ook bij bestaande software zal dit potentieel een significant effect hebben op de prestaties.

De lengte van de pipelines binnen de execution units is ongewijzigd ten opzichte van Ivy Bridge en diens voorlopers: 14 stages om precies te zijn. Dat betekent dat een verkeerd ingeschatte branch niet voor grotere problemen zorgt dan voorheen. 

 

Om ervoor te zorgen dat de execution units zo goed mogelijk gevuld kunnen blijven worden, heeft Intel vrijwel alle buffers binnen de cores tegen het licht gehouden en waar mogelijk vergroot. Zo is het aantal instructies dat de processor in geoptimaliseerde volgorde kan uitvoeren verhoogd van 168 naar 192. Ook het aantal uitstaande bewerkingen voor het geheugen en de registers binnen de processor zijn verhoogd. 

De snelheid waarmee de cores met het L1-cachegeheugen communiceren heeft Intel verdubbeld. Was dat bij Ivy Bridge nog 32 bytes/cycle lezen en 16 bytes/cycle schrijven, bij Haswell is dat 64 bytes/cycle en 32 bytes/cycle. Ook de verbinding tussen de L1-cache en de L2-cache is verdubbbeld in snelheid naar 64 bytes/cycle. 

De capaciteit van de L1- en L2-caches blijft ongewijzigd op 64 kB respectievelijk 256 kB per core. Hoewel er geruchten waren dat Intel de hoeveelheid L3-cache zou gaan verhogen bij Haswell, blijkt ook die afhankelijk van het model maximaal 8 MB te blijven.

 

0
*