ARM Cortex-A72 preview: in jouw volgende smartphone?

8 reacties
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Van 57 naar 72
  3. 3. Beloftes
  4. 4. Architectuur
  5. 5. 5-wide
  6. 6. In vergelijking met Intel
  7. 8 reacties

5-wide

Verderop in de pipeline vinden we de decoder en de dispatcher. Deze chiponderdelen verwerken enerzijds de binnenkomende ARM assembler-instructies naar een interne code die door de CPU verwerkt kan worden en sturen anderzijds die instructies in kleinere blokken (zogenaamde MicroOps) door naar de daadwerkelijke verwerkingseenheden.

Net als bij de A57 kan de decoder drie binnenkomende instructies per klokslag verwerken, maar het stroomverbruik van de decoder is verder teruggebracht. Voor verschillende 64-bit instructies zijn er extra instruction-fusion functies toegevoegd, waardoor bepaalde instructies samengevoegd verder verwerkt kunnen worden. De grootste verbetering is er bij de dispatcher, die interne instructies dus opbreekt in kleinere MicroOps en doorvoert naar de execution units. Kon de dispatcher bij de Cortex-A57 drie instructies per klokslag doorvoeren naar de verwerkingseenheden, bij de A72 zijn dat er vijf, wat de core in jargon dus 5-wide maakt. Naar verluidt wordt iedere instructie in programmacode gemiddeld opgedeeld naar 1,08 MicroOps, zodat de cores probleemloos de extra verwerkingssnelheid goed kunnen benutten. Het feit dat er iedere klokslag meer MicroOps naar de execution units kunnen, is één van de belangrijkste redenen voor de de verbeterde IPC. Op dit niveau van de chip heeft ARM verder ook verbeteringen doorgevoerd op het vlak van aansturing van de registers, voornamelijk om stroom te besparen.

Execution units

Net als bij de Cortex-A57 vinden we in de back-end acht execution units. Dit zijn achtereenvolgens een Load unit (om instructies die data ophalen uit geheugen te verwerken), een Store unit (om instructies die data opslaan te verwerken), twee single-cycle integer units (geschikt voor optellen/aftrekken), één multi-cycle integer unit (geschikt voor vermenigvuldigen), een branch unit (voor het verwerken van vertakkingen) en twee floating point units met ondersteuning voor NEON-instructies.

            Bij bijna alle execution units is de verwerkingssnelheid verhoogd, zonder de mogelijkheid om op hoge klokfrequentie te werken in gevaar te brengen. Zo is de maximale verwerkingsduur van de floating point units teruggebracht van 9 naar 6 klokslagen. Een FMUL instructie (floating point vermenigvuldigen) is teruggebracht van 5 naar 3 en een FADD (floating point optellen) van 4 naar 3 klokslagen, om maar twee voordelen te noemen. Met de rest van de onderdelen van de chip erbij geteld (inclusief de front-end dus) is de totale maximale lengte van de pipeline teruggebracht van 19 naar 16 stappen.

            Ook bij de integer units zijn veel verbeteringen doorgevoerd. Zo is de bandbreedte bij zogenaamde Radix-16 berekeningen (veel gebruikt bij encryptie) verdubbeld en kunnen de execution units CRC-berekeningen uitvoeren in één klokslag, drie keer sneller dan voorheen. Buiten verbeteringen als deze zijn ook de execution units alle fysiek opnieuw ontworpen, waardoor ze minder ruimte innemen en dus minder stroom verbruiken.


Het aantal en type execution units per core is gelijk gebleven met de Cortex-A57, maar de excutions units zijn wel versneld.

Advertentie
0

Hardware Info maakt gebruik van cookies

Hardware Info plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Hardware Info relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie.

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Hardware Info contextuele advertenties te tonen op basis van pagina's die je hebt bezocht.

    janee

    Hardware Info genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Hardware Info gevolgd worden. Deze data wordt maximaal 2 weken bewaard. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden.

    janee