Intel Pentium 4 Extreme Edition 3.73 GHz vs. AMD Athlon 64 FX-55

32 reacties
Inhoudsopgave
  1. 1. Oud en nieuw
  2. 2. De concurrentie
  3. 3. Intel Pentium 4 Processors Specificatie-tabel
  4. 4. Benchmarks
  5. 5. Benchmarks (Business Winstone 2004 / Content Creation Winstone 2004)
  6. 6. Benchmarks (Unreal Tournament 2004 / Doom 3)
  7. 7. Benchmarks (MP3 / DivX encoding)
  8. 8. Benchmarks (Cinebench 2003 / Sciencemark AES)
  9. 9. Benchmarks (WinRAR 3.40 / PCMark04)
  10. 10. Conclusie
  11. 32 reacties

Oud en nieuw

In Hardware.Info Magazine #1//2005 besteedden we uitgebreid aandacht aan de nieuwste generatie Pentium 4 processors die Intel recentelijk heeft geïntroduceerd. De nieuwe '6-serie' heeft niet alleen een dubbele hoeveelheid L2-cache (2 MB in totaal), maar bevat ook 64-bit extensies, de XD-bit anti-virus technologie en verbeterd powermanagement onder de naam EIST (Enhanced Intel Speedstep Technology). Op pagina 12 tot en met 17 van het blad worden al deze nieuwe zaken van de nieuwe Pentium 4 uitgebreid belicht.

Naast de nieuwe 6-serie Pentium 4's heeft Intel ook een nieuwe Extreme Edition uitgebracht op basis van de nieuwe Prescott-core met 2 MB cache. Deze nieuwe Extreme Edition heeft geen modelnummer gekregen en gaat zodoende door het leven als 'Intel Pentium 4 Extreme Edition 3.73 GHz'. Voor de deadline van Hardware.Info Magazine #1/2005 waren helaas nog geen samples van de nieuwe Extreme Edition beschikbaar, maar inmiddels is dat wel het geval. De grote vraag is natuurlijk hoe Intels nieuwe vlaggeschip presteert ten opzichte van de vorige Pentium 4 Extreme Edition en natuurlijk ten opzichte van AMD's paradepaartje, de Athlon 64 FX-55.


Intel Pentium 4 Extreme Edition 3.73 GHz.

Oud en nieuw

Met de komst van de nieuwe Pentium 4 EE 3.73 GHz is de vorige Extreme Edition werkend op 3.46 GHz direct end-of-life. Op het eerste gezicht lijkt het puur dat de klokfrequentie verhoogd is, maar niets is minder waar: de nieuwe Extreme Edition is een wezenlijk andere processor dan zijn voorloper...

De Pentium 4 Extreme Edition 3.46 GHz maakt gebruik van de zogenaamde Gallatin CPU-core, die door Intel ook lang gebruikt werd voor haar Xeon-reeks. De Gallatin is afgeleid van de vorige generatie Pentium 4 (Northwood) en werd geproduceerd middels een 130 nm procédé. De Extreme Edition onderscheidde zich op twee vlakken van de normale Pentium 4's: allereerst heeft de Gallatin-core naast 512 kB L2-cache ook nog eens 2 MB (2048 kB) L3-cache. Daarnaast werkte de Extreme Edition met een 1066 MHz frontside-bus, welke een 33% snellere datadoorvoersnelheid biedt dan de 800 MHz FSB van de normale Pentium 4's. De extra cache en de snelle FSB zorgden ervoor dat de Extreme Edition beter presteerde bij applicaties waarin de processor veel data moet uitwisselen met het geheugen en/of de videokaart. Games zijn hier nog wel het beste voorbeeld van. Aangezien de oude Extreme Edition nog gebaseerd was op Northwood technologie, moesten we bij de Pentium 4 EE 3.46 GHz alle nieuwtjes uit het Prescott-tijdperk, zoals SSE3 support, missen.

De nieuwe Pentium 4 Extreme Edition 3.73 GHz maakt, zoals we al schreven in Hardware.Info Magazine #1/2005, gebruik van exact dezelfde core als de nieuwe Pentium 4 6-serie. Deze Prescott 2.0 wordt geproduceerd in een 90 nm procédé en bevat zoals gezegd een groot aantal nieuwe technologieën, waaronder 64-bit extensies en XD-bit. De nieuwe Extreme Edition heeft net als de 6-serie 2 MB L2-cache aan boord en heeft verder geen L3-cache. Onder de streep heeft de nieuwe EE dus wat minder cache dan zijn voorloper. Gebleven is de 1066 MHz frontside-bus. Dit is op dit moment echter het enige dat de Extreme Edition onderscheidt van de Pentium 4 6-serie.

Pipeline perikelen

Toen Intel de eerste Prescott Pentium 4's introduceerde, schreven we in Hardware.Info Magazine #1/2004 over een verschil tussen de Northwood en de Prescott dat wat minder zichtbaar is. Bij de Prescott heeft Intel de pipeline verlengd om zo hogere kloksnelheden mogelijk te maken. In die pipeline worden complexe instructies door de processor opgedeeld in een groot aantal minder complexe deel instructies. Om er een voorbeeldje uit de echte wereld bij te pakken: een taak als 'Rijd weg met de auto' zou worden opgedeeld in 'Maak de deur open', 'Ga zitten', 'Start de motor', 'Zet de versnelling in z'n 1', 'Doe de verlichting aan' en 'Geef gas'. Een processor kan iedere klokslag (dus 3 miljoen keer per seconde bij een 3 GHz processor) zo'n deelbewerking uitvoering. Dankzij pipelining is het zo dat de processor altijd met meerdere instructies tegelijkertijd bezig is: deelbewerking 10 van instructie A wordt tegelijkertijd uitgevoerd met deelbewerking 9 van instructie B, deelbewerking 8 van instructie C, en zo verder. Iedere klokslag rolt er zodoende één volledig uitgewerkte instructie uit de pipeline.

Bij de Northwood bestond de pipeline van de Pentium 4 uit 20 deelbewerkingen. Bij de Prescott heeft men een paar van die deelbewerkingen nog verder uitgesplitst en bestaat de pipeline nu uit 31 deelbewerkingen. Deze zijn stuk voor stuk minder complex, zodat de processor makkelijker op hogere snelheden kan werken zonder in de problemen te komen. Op het eerste gezicht lijkt het allemaal niks uit te maken, aangezien nog steeds iedere klokslag één volledig uitgewerkte instructie uit de pipeline rolt. Toch heeft zo'n langere pipeline ook nadelen. Belangrijk om te weten is dat een processor niet altijd alle instructies keurig in de aangeleverde volgorde uitvoert. Als er een andere volgorde efficiënter uit te voeren is, zal de processor de instructies omgooien. Als we vier achtereenvolgende instructies A, B, C en D hebben, kan het best zijn dat de processor ze uitvoert als D, B, A, C. Nu kan het echter soms zo zijn dat de uitkomst van een eerdere instructie bepalend is voor een volgende: zo kan het resultaat van A ervoor zorgen dat de processor met ofwel D ofwel E verder moet gaan. Binnen de processor zit een technologie (branch prediction) die dit soort zaken vooraf probeert te voorspellen. De processor kan instructie D dus al in de pipeline invoeren, nog vóórdat het resultaat van A bekend is. Mocht nu uiteindelijk blijken dat de uitkomst van instructie A uitwijst dat niet instructie D, maar instructie E moet worden uitgevoerd, dan is er al veel werk voor niks verzet en moet E helemaal vanaf het begin in de pipeline worden gestopt. Bij een pipeline van 20 deelbewerkingen duurt het dan 20 klokslagen eer het resultaat van E eruit rolt, maar bij een pipeline met 31 onderdelen duurt het dus ook 31 klokslagen: ruim anderhalf keer zo lang!

Vandaar dat een Pentium 4 met Northwood-core op dezelfde klokfrequentie vaak wat sneller is dan een Pentium 4 met Prescott-core. Zeker bij applicaties waar veel moeilijk uit te voeren  branchprediction om de hoek komt kijken - onze MP3-benchmark is daar het beste voorbeeld van - is de langere pipeline de Prescott soms fataal. Dit alles is dus nog een interessant verschil tussen de oude en de nieuwe Extreme Edition. Hoewel de oude EE op 'slechts' 3.46 GHz werkt en de nieuwe op 3.73 GHz, zullen we verderop zien dat de extra cache en de kortere pipeline er soms voor zorgen dat de oude EE tóch de snelste is.

0
*