AMD Athlon van binnen en van buiten

2 reacties
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Wat is de AMD Athlon nu precies?
  3. 3. De positionering van de AMD Athlon in de huidige PC-markt
  4. 4. Wanneer en wie?
  5. 5. De specificaties
  6. 6. De Athlons Systeembus
  7. 7. De Athlons Architectuur
  8. 8. Het AMD Athlon Productie Procédé
  9. 9. AMD's eigen AMD Athlon Chipset
  10. 10. Overklokken
  11. 11. Conclusie
  12. 2 reacties

De specificaties

Na alle commerciële informatie is ondertussen over de specificaties van de nieuwe CPU. We zullen eerst een bekijken hoe AMD e.e.a. in drie zinnen samenvat:

De AMD Athlon zet een nieuwe standaard in x86 performance, zowel op integer, floating point en multimedia gebied

De AMD Athlon biedt volgende generatie mogelijkheden in een hedendaagse CPU

De AMD Athlon creëert "the ultimate computing experience"

Nogal pretentieuze doelstellingen. Zeker als je de getallen bekijkt die AMD ons voorspiegelt: tot meer dan 25% sneller bij integer-berekeningen, tot 45% sneller bij floating point-berekeningen d en tot 40% sneller bij 3D programmatuur. (Alles in vergelijking met een Pentium III op dezelfde frequentie). Of dit alles waar is zullen we zien in ons AMD Athlon test rapport. Eerst zullen we kijken naar de specificaties die dit alles waar moeten maken. Er zal blijken dat de visie achter de AMD Athlon neerkomt op "van alles veel". Dit resulteert in veel cache, veel execution units, veel registers en veel pipeline stages.

Microarchitectuur

In de beschrijving van de architectuur verderop zullen we zien dat de AMD Athlon maarliefst negen verschillende execution units, ofwel die delen van de CPU die de werkelijke bewerkingen uitvoeren, heeft. Aangezien al deze units ook nog eens volledige gepipelined zijn kan er aan zeer veel processen tegelijkertijd gewerkt worden. De 9 execution-units zijn verdeeld in 3 super-scalar integer units (dus voor berekeningen met gehele getallen), 3 super-scalar floating point units (dus voor berekeningen met drijvende komma getallen en berekeningen voor de MMX en 3DNow! multimedia toevoegingen) en 3 super-scalar adres-berekening units.

Floating Point units

Floating point operaties zijn tot nu toe altijd het zwakke punt van AMD geweest. Altijd als Intel een vergelijkende test uitvoerde pakten ze testsoftware die veel floating point berekening vereiste, en de K5 en K6 processoren zakten als een plumpudding in elkaar. Voor de AMD Athlon is AMD van de grond af aan begonnen om een geheel nieuwe floating point units te schrijven. Het oude nadeel van AMD is nu juist haar sterkste punt geworden. De AMD Athlon heeft die 3 super-scalar floating point units die verder ook nog eens compleet gepipelined zijn. Deze pipelining gaat zelfs tot 17 stages diep! Ter vergelijking: de Intel Pentium III heeft slechts twee Floating Point units, waarvan er maar 1 volledig gepipelined is. Met deze excentriek hoge floating point specificaties beweert AMD een tot 40% snellere floating point unit te hebben dan Intel.

Aangezien pipelining de grootste performancewinst bij de AMD Athlons floating point unit opbrengt heb ik een apart artikel geschreven waarin dit systeem in een makkelijke vorm wordt uitgelegd. Dit artikel is zeker aan te raden voor iedereen die iets meer wil weten over processor architecturen. Klik hier om het pipelining artikel te lezen!

Cache technologie

Ook op het gebied van cache heeft AMD veel voorsprong op Intel. De L1 cache is bij AMD maarliefst 128 kb! Dit is vier maal zoveel als de L1 cache van de Pentium III (slechts 32 kb). Deze 128 kb is opgedeeld in 64 kb instructie-cache en 64 kb data-cache.

De L2 cache van de AMD Athlon draait, net als bij de huidige Pentium III, op halve processor-snelheid. Er is echter ook een mogelijkheid om in te stellen dat hij op eenderde processor-snelheid werkt: dit i.v.m. de aankomende AMD Athlons tot 1 GHz! De L2 cache van de huidige Athlons is, net als bij de Pentium III, 512 kb in totaal. De AMD Athlon ondersteund echter L2 cache tot maarliefst 8 MB! CPU's met zoveel cache zullen we dus later voornamelijk bij de AMD Athlon Ultra's tegenkomen.

3DNow! technologie en Multimedia Performance

Net als de K6-2 en K6-III maakt ook de AMD Athlon gebruikt van AMD's 3DNow! instructie-set uitbreiding. Deze uitbreiding versnelt vooral daarvoor geoptimaliseerde 3D- en Multimediaprogrammatuur. Dit gebeurt onder andere door SIMD (Single Instruction Multiple Data) technieken, waarbij dezelfde bewerking tegelijkertijd wordt toegepast op meerdere stukken data. De originele 3DNow! instructieset biedt overigens ook versnelling aan audio en video decoding.

In de tussentijd heeft Intel uiteraard ook niet stilgezeten en de SSE uitbreiding uitgebracht. Intel's variant van 3DNow!. SSE heeft in principe dezelfde functionaliteit als 3DNow!, alleen bracht Intel ook versnelling voor audio en video encoding.

Bij de nieuwe AMD Athlon heeft AMD uiteraard ook weer e.e.a. terug afgekeken bij Intel, wat resulteert in een uitbreiding op de originele 3DNow! standaard. De nieuwe instructies versnellen, net als Intel SSE, o.a. audio en video encoding en verschillende (internet) streaming applicaties.

AMD zou echter AMD niet zijn als ze ook niet iets hadden toegevoegd: 5 nieuwe DSP instructies versnellen zaken als soft modems, soft xDSL, AC-3 en MP3.

De uiteindelijke tabel van features ziet er dan als volgt uit:

Instructieset Uitbreiding AMD 3DNow! Intel SSE
Single Precision Floating Point SIMD (Single Instruction Multiple Data) Ja Ja
Ondersteuning voor 4 FP operaties per klok-cyclus Ja Ja
Prefetch Controls Ja Ja
Cache Controls Ja Ja
Streaming Controls Ja Ja
DSP/Communicatie Extensies Ja Nee

Nog even wat uitleg voor personen die denken "waar heb ik dat 3DNow! eigenlijk voor nodig, want geen enkel programma dat ik ken ondersteund het". Een programma hoeft namelijk niet expliciet voor 3DNow! (of SSE) geoptimaliseerd te zijn, wil het er van profiteren.

Het mooiste voorbeeld zijn 3D games. Zoals ook al beschreven in ons 3D Woordenboek gebruiken programmeurs van 3D games verschillende 3D API's om 3D beelden op het scherm te toveren. Deze API's zijn een soort van instructiebibliotheken die het gebruik van allerhande 3D effecten mogelijk maakt. Als deze API's geoptimaliseerd zijn voor 3DNow! dan zal meteen alle programmatuur die deze API gebruikt er ook van profiteren. Als voorbeeld is de meest gebruikte 3D API DirectX 6.1 geoptimaliseerd voor zowel 3DNow! als SSE. Aangezien vrijwel alle 3D games DirectX gebruiken zijn al deze spellen meteen geoptimaliseerd.

Een laag lager is er echter ook nog optimalisatie. Deze API's spreken namelijk weer de handware drivers van bijvoorbeeld de videokaart aan. Als deze drivers ook zijn geoptimaliseerd voor 3DNow! (of SSE) zit hier ook nog eens een versnelling. De drivers van de vier grote graphics chip fabrikanten (nVidia, S3, Matrox en 3dfx) zijn allen geoptimaliseerd voor AMD's 3DNow!.

De hoogste snelheid winst krijgt met echter inderdaad nog altijd als het programma zelf ook 3DNow! geoptimaliseerd is. Dit zijn inderdaad nog niet erg veel programma's en games, maar de lijst groeit nog iedere dag. Op de AMD Website is een lijst te vinden met alle 3DNow! geoptimaliseerde programmatuur. 

0
*