AMD FX-8150, -8120, -6100, -4100 Bulldozer review

137 reacties
4 besproken producten
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Nieuwe architectuur
  3. 3. Modules
  4. 4. Multi-threading
  5. 5. Architectuur
  6. 6. De FX-chip: Zambezi
  7. 7. Geheugencontroller en turbo-modus
  8. 8. Positionering en modellen
  9. 9. Prijzen en beschikbaarheid
  10. 10. Platform
  11. 11. Test
  12. 12. Benchmarks: 3DMark Vantage CPU
  13. 13. Benchmarks: Tom Clancy's H.A.W.X. 2
  14. 14. Benchmarks: Dirt 3
  15. 15. Benchmarks: Crysis 2
  16. 16. Benchmarks: Adobe Photoshop CS4
  17. 17. Benchmarks: Panorama Factory v5
  18. 18. Benchmarks: 720p MPEG naar x264 video-encoding
  19. 19. Benchmarks: Cyberlink MediaShow Espresso 6.0
  20. 20. Benchmarks: Cyberlink PowerDirector 8 - 1 min. HD-video incl. effecten
  21. 21. Benchmarks: 60 min. audio naar FLAC (fpFLAC)
  22. 22. Benchmarks: Cinebench 11.5
  23. 23. Benchmarks: PovRay 3.7b37 – Chess 2 1024x768
  24. 24. Benchmarks: WinRAR 3.93 - 317 MB data
  25. 25. Benchmarks: 7Zip - 317 MB data
  26. 26. Benchmarks: TrueCrypt AES encryptie
  27. 27. Benchmarks: Microsoft Excel 2010 - MonteCarlo benchmark
  28. 28. Stroomverbruik: Idle / Cinebench 11.5
  29. 29. FX versus Phenom II klok-voor-klok
  30. 30. Overklokken: 5,1 GHz booten en 4,9 GHz stabiel
  31. 31. Windows 8
  32. 32. Toekomst
  33. 33. Conclusie
  34. 4 besproken producten
  35. 137 reacties

Architectuur

In onderstaande afbeelding is de architectuur van Bulldozer wat verder uitgewerkt. Bovenin vinden we vier decoders voor x86 instructies, volgens AMD meer dan voldoende om alle pipelines gevuld te houden. De intructiecache bedraagt 64 kilobyte. De branch prediction algoritmes zijn volgens AMD verder geoptimaliseerd, al blijft de exacte werking daarvan één van de best bewaarde geheimen van processorfabrikanten.

Interessant zijn de verschillende pipelines binnen de integer en floating point cores. Elk van beide integer cores bevat vier execution units, die tegelijkertijd instructies kunnen verwerken. Twee daarvan zijn geschikt om daadwerkelijk berekeningen met getallen uit te voeren. Allebei zijn ze geschikt voor simpele bewerkingen (optellen, aftrekken, bitwise compare, etc.), één is verder geschikt voor vermenigvuldigen, de ander voor delen. De twee andere pipelines zijn puur bedoeld voor het verwerken van geheugenadressen. Op dit vlak lijkt Bulldozer een stapje terug ten opzichte van de architectuur van de Phenom II's: deze hebben zes integer pipelines per core, drie voor data en drie voor geheugenadressen, waarvan er maximaal drie tegelijkertijd gebruikt kunnen worden. Wanneer er puur berekeningen gedaan hoeven te worden, kan de Phenom II telkens drie integer instructies per core per klokslag verwerken, een Bulldozer core slechts twee. Volgens AMD is de missende derde pipeline weggehaald omdat deze procentueel meer plek inneemt dan dat hij daadwerkelijk aan prestaties toevoegt. Dat zo'n extra pipeline flink wat extra transistors vergt - en dus de processor duurder maakt - staat buiten kijf. Maar of het een slimme zet was om deze weg te bezuinigen, wagen we te betwijfelen.

Het floating point-gedeelte van de Bulldozer-module komt qua architectuur eigenlijk vrijwel geheel overeen met dat van AMD's oudere processors, met een belangrijk verschil: ondersteuning voor nieuwe instructies. We schreven al in de inleiding dat de nieuwe processors ondersteuning krijgen voor SSE 4.1, SSE 4.2, AESNI en AVX. Daarmee zijn Bulldozer gebaseerde CPU's qua instructieondersteuning geheel op hetzelfde niveau als Intels Sandy Bridge processors.

AMD gaat zelfs nog een stapje verder en biedt ondersteuning voor fused multiply add (FMA) instructies met 4-operands, wat betekent dat AMD berekeningen als 'D = A x B + C' in één keer kan uitvoeren. Dergelijke instructies kunnen zeer veel (multimedia) software versnellen en staan zodoende hoog op het verlanglijstje van veel developers. Processors hebben daar tot dusver nog drie instructies voor nodig: 1: B = A x B, 2: C = B + C, 3: D = C. Intel gaat FMA pas ondersteunen bij haar volgende nieuwe architectuur, Haswell, eind volgend jaar. Intel kiest echter voor een variant met maximaal drie operands, bijvoorbeeld 'C = A x B + C'.

Verschillende compilers, waaronder GCC en de exemplaren van PGI en Microsoft, zullen AMD's FMA-instructies ondersteunen, maar het is maar de vraag of developers die optie daadwerkelijk gaan gebruiken als de uiteindelijke code alleen op AMD-processors uitgevoerd kan worden. Of Intels uiteindelijke FMA-implementatie ook gaat werken op Bulldozer is nu nog niet te zeggen. Het is dus een voordeel van de AMD-architectuur waarvan we ons helaas kunnen afvragen of we er ooit van zullen profiteren.

Naast FMA heeft AMD nog een handvol andere eigen instructies op verzoek toegevoegd, waarvan opnieuw de vraag is of men die op eigen houtje tot een succes kan maken.

Iedere Bulldozer-module heeft tenslotte 2 MB gedeelde L2-cache. Je zou '1 MB per core' kunnen zeggen, maar in single-threaded applicaties kan één van beide cores de volledige 2 MB gebruiken.Een enkele Bulldozer-module, geproduceerd met 32nm transistors, bevat zo'n 213 miljoen transistors en meet 30,9 mm².


4 besproken producten

Vergelijk alle producten

Vergelijk   Product Prijs
AMD FX-4100 Boxed

AMD FX-4100 Boxed

  • Socket AM3+
  • 3.6 GHz
  • 4 cores
  • 95 W
  • 32 nm
Niet verkrijgbaar
AMD FX-6100 Boxed

AMD FX-6100 Boxed

  • Socket AM3+
  • 3.3 GHz
  • 6 cores
  • 95 W
  • 32 nm
Niet verkrijgbaar
AMD FX-8120

AMD FX-8120

  • Socket AM3+
  • 3.1 GHz
  • 8 cores
  • 125 W
  • 32 nm
Niet verkrijgbaar
AMD FX-8150

AMD FX-8150

  • Socket AM3+
  • 3.6 GHz
  • 8 cores
  • 125 W
  • 32 nm
Niet verkrijgbaar
0
*