AMD FX Bulldozer processors preview

48 reacties
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Nieuwe architectuur
  3. 3. Modules
  4. 4. Multi-threading
  5. 5. Architectuur
  6. 6. Zambezi
  7. 7. Modelnummers
  8. 8. Servermodellen
  9. 9. Prestaties
  10. 10. Conclusie
  11. 48 reacties

Architectuur

In onderstaande afbeelding staat de architectuur van Bulldozer wat verder uitgewerkt. Bovenin vinden we vier decoders voor x86 instructies, volgens AMD meer dan voldoende om alle pipelines gevuld te houden. De intructiecache bedraagt 64 kilobyte. De branch prediction algoritmes zijn volgens AMD verder geoptimaliseerd, al blijft de exacte werking daarvan één van de best bewaarde geheimen van processorfabrikanten.

Interessant zijn de verschillende pipelines binnen de integer en floating point cores. Elk van beide integer cores bevat vier execution units, die tegelijkertijd instructies kunnen verwerken. Twee daarvan zijn geschikt om daadwerkelijk berekeningen met getallen uit te voeren. Allebei zijn ze geschikt voor simpele bewerkingen (optellen, aftrekken, bitwise compare, etc.), één is verder geschikt voor vermenigvuldigen, de ander voor delen. De twee andere pipelines zijn puur bedoeld voor het verwerken van geheugenadressen. Op dit vlak lijkt Bulldozer een stapje terug ten opzichte van de K8-architectuur van de Phenom II's: deze hebben zes integer pipelines per core, drie voor data en drie voor geheugenadressen, waarvan er maximaal drie tegelijkertijd gebruikt kunnen worden. Wanneer er puur berekeningen gedaan hoeven te worden, kan de Phenom II telkens drie integer instructies per core per klokslag verwerken, een Bulldozer core slechts twee. Volgens AMD is de missende derde pipeline weggehaald omdat deze procentueel meer plek inneemt dan dat hij daadwerkelijk prestaties toevoegt. Of dat in de praktijk ook zo is, zullen benchmarks moeten uitwijzen.

Het floating point gedeelte van de Bulldozer module komt qua architectuur eigenlijk vrijwel geheel overeen met dat van AMD's bestaande processors, met een belangrijk verschil: ondersteuning voor nieuwe instructies. We schreven al in de inleiding dat de nieuwe processors ondersteuning krijgen voor SSE 4.1, SSE 4.2, AESNI en AVX. Daarmee zijn Bulldozer gebaseerde CPU's qua instructieondersteuning geheel op hetzelfde niveau als Intels Sandy Bridge processors.

AMD gaat zelfs nog een stapje verder en biedt ondersteuning voor fused multiply add (FMA) instructies met 4-operands, wat betekent dat AMD berekeningen als 'D = A x B + C' in één keer kan uitvoeren. Dergelijke instructies kunnen zeer veel (multimedia) software versnellen en staan zodoende hoog op het verlanglijstje van veel developers. Huidige processors hebben daar nog drie instructies voor nodig: 1: B = A x B, 2: C = B + C, 3: D = C.

Intel gaat FMA pas ondersteunen bij haar volgende nieuwe architectuur, Haswell, eind volgend jaar. Intel kiest echter voor een variant met maximaal drie operands, bijvoorbeeld 'C = A x B + C'.

Verschillende compilers, waaronder GCC en de exemplaren van PGI en Microsoft, zullen AMD's FMA-instructies ondersteunen, maar het is maar de vraag of developers die optie daadwerkelijk gaan gebruiken als uiteindelijke code alleen op AMD processors uitgevoerd kan worden. Of Intels uiteindelijke FMA-implementatie ook gaat werken op Bulldozer is nu nog niet te zeggen.

Naast FMA heeft AMD nog een handvol andere eigen instructies op verzoek toegevoegd, waarvan opnieuw de vraag is of men die op eigen houtje tot een succes kan maken.

Iedere Bulldozer module heeft tenslotte 2 MB gedeelde L2-cache. Je zou '1 MB per core' kunnen zeggen, maar in single-threaded applicaties kan één van beide cores de volledige 2 MB gebruiken. Een enkele Bulldozer module, geproduceerd met 32nm transistors, bevat zo'n 213 miljoen transistors en meet 30,9 mm².

Advertentie
0

Hardware Info maakt gebruik van cookies

Hardware Info plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Hardware Info relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie.

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Hardware Info contextuele advertenties te tonen op basis van pagina's die je hebt bezocht.

    janee

    Hardware Info genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Hardware Info gevolgd worden. Deze data wordt maximaal 2 weken bewaard. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden.

    janee