[Pro] IBM presenteert Power10-processors: 7 nm en 3x sneller bij zelfde verbruik

16 reacties

IBM heeft nieuwe 7 nm Power-processors aangekondigd. De Power10-generatie is de opvolger van Power9 en zou onder andere een 3x hogere energie-efficiëntie bieden. Daarnaast is de beveiliging verbeterd, zijn AI-taken fors sneller en worden geheugenclusters mogelijk. In 2021 komen de eerste systemen beschikbaar.

Hardware

Tot 240 cores en 1920 threads

Het is verstandig om eerst de mogelijke hardware-opstellingen te bespreken. Die kunnen namelijk verwarrend zijn. Een enkele chip heeft 15 ingeschakelde cores en vier of acht threads per core. Dat betekent dus 15 cores en 60 of 120 threads per chip.

IBM biedt single-chip modules aan, met dus de 15 cores. Hiervan kunnen maximaal 16 sockets gecombineerd worden, voor maximaal 240 cores en 1920 threads op meer dan 4 GHz. Daarnaast komen er dual-chip modules met twee 15C-chips. Hiervan kunnen maximaal 4 sockets samen, voor 120 cores en 960 threads op meer dan 3,5 GHz.

Tot 3x sneller, 7 nm en PCIe 5

De chips worden gebakken op het 7nm-proces van Samsung Semiconductor. Dit belooft een tot 3x hogere energie-efficiëntie of tot 3x hogere prestaties bij hetzelfde verbruik. Een single-chip module is 602 mm2 groot en heeft 18 miljard transistors. Fysiek hebben ze 16 cores, maar om de yields te verhogen wordt één core standaard uitgeschakeld. Elke core krijgt 2 MB L2-cache en in totaal 120 MB L3-cache per chip.

Ook de i/o is vernieuwd. Standaard is er ondersteuning voor PCIe 5 met 64 lanes op 32 GT/s. Verder biedt elke chip twee geheugen-interfaces: Open Memory Interface en IBM's eigen PowerAxon 2.0. Middels beide is 128x 32 GT/s mogelijk, dus 1 TB/s. In eerste instantie lijkt het werkgeheugen echter beperkt tot 4 TB per socket bij 410 GB/s. Later kan ook ddr5 gebruikt worden met OMI. Vermoedelijk komt dan het volledige potentieel tot zijn recht.

Geheugen, beveiliging en AI

Met de Power10-generatie introduceert IBM nog meer nieuws. Dit kan opgedeeld worden in drie onderwerpen: geheugen, beveiliging en kunstmatige intelligentie.

Multi-petabyte geheugenclusters

Die eerste betreft de mogelijkheid voor geheugenclusters, genaamd Memory Inception. Systemen in een cluster kunnen zo het werkgeheugen van andere systemen gebruiken, alsof dit het eigen geheugen is. De techniek werkt via de PowerAxon 2.0-interface en kan in ieder geval meerdere petabytes aan werkgeheugen aan. Door Memory Inception kan het werkgeheugen verdeeld worden tussen systemen, waardoor het maximaal beschikbare ram veel hoger is, zonder dat elk systeem die hoeveelheid moet hebben. Zeker met dit kostbare soort werkgeheugen kan dat veel geld besparen.

Hardwarematige encryptie én sneller

Op het vlak van beveiliging heeft IBM ook niet stilgezeten. Zo ondersteunen de chips hardwarematige transparent memory encryption, met als doel end-to-end beveiliging. Verder biedt het hardwarematige beveiliging en isolatie van containers, bijvoorbeeld bij virtuele machines. Ook is gedacht aan beveiligingslekken die later ontdekt kunnen worden in de hardware. Power10 is ontworpen voor dynamic execution register control, waardoor gemakkelijker applicaties ontwikkeld kunnen worden die bestand zijn tegen dit soort lekken, zonder de forse prestatie-impact. Met al die encryptie moet de chip het ook aankunnen. Het aantal encryptie-engines voor aes-versleuteling is daarom verviervoudigd.

AI-inferentie 10-20x sneller

De laatste grote feature is dat de prestaties bij kunstmatige intelligentie fors verbeterd zijn. De cores zijn aangepast met verbeterde simd (single-input-multiple-data) en de toevoeging van Matrix Math Accelerators. Daarnaast is de hoeveelheid L2-cache vier keer groter en is de architectuur aangepast, met toevoeging van AI-datatypen. IBM claimt dat Power10 tot 10x, 15x en 20x sneller AI-inferentie uitvoert voor respectiecvelijk FP32-, BFloat16- en INT8-berekeningen.

Tweede helft 2021

Voorlopig is het nog even afwachten voordat de Power10-chips beschikbaar komen. IBM verwacht dat er in de tweede helft van 2021 systemen beschikbaar komen met deze hardware.

Bron: IBM

« Vorig bericht Volgend bericht »
0
*