[Pro] Centaur maakt eerste CPU met on-chip AI-coprocessor

5 reacties

Centaur heeft de eerste cpu onthuld met een coprocessor voor AI-taken aan boord. De chip maakt gebruik van de x86-architectuur en heeft 8 cores en 44 pcie-lanes.

Volgens de chipontwerper moet hij 'uitstekende AI-prestaties bieden, zodat de x86-cpu-cores beschikbaar blijven voor general purpose-taken'. De softwarekant van het verhaal zou nog niet volledig uitontwikkeld zijn, maar een werkend model heeft in AI-benchmarks 20 tops aan rekenkracht laten zien. De coprocessor kan verder 20 terabyte per seconde aan data verwerken.

In de MobileNet-V1-test waarmee afbeeldingen worden geclassificeerd, behaalde het een latency van 330 microseconden. Dat is de laagste latency van alle chips die het programma tot nu toe heeft getest. In SSD MobileNet-V1 voor beelddetectie was de latency van 1,54 milliseconden met 140 microseconden een fractie langzamer dan het snelste resultaat. Door gebrek aan optimalisaties kunnen de prestaties nog worden verdrievoudigd, volgens Centaur. Hetzelfde geldt voor een test genaamd GNMT, waarmee tekst kan worden vertaald. Dit resultaat zou ook minimaal 150% sneller zijn na de nodige optimalisaties. In de ResNet-50 V1.5-test was de npu even snel als 22,9 normale cpu-cores. Opvallend is dat deze accelerator een busbreedte van 32.768-bit heeft, oftewel 4096-byte.

De rest van de chip heeft een geïntegreerde southbridge en een quad-channel ddr4-controller voor snelheden tot ddr4-3200. De cpu draait op 2,5 GHz, ondersteunt de avx512-instructieset en heeft 16 MB L3-cache. Opvallend is dat de gehele chip slechts 195 vierkante mm meet op TSMC's 16nm-procedé, terwijl de chip waarmee het de concurrentie aangaat een stuk groter zouden zijn. Het is helaas nog niet duidelijk wat het exacte stroomverbruik van de chip is, maar als we de stilstaande ventilator van de voeding in de afbeelding en de relatief kleine heatsink in acht nemen, kunnen we aannemen dat hij niet extreem veel zal verbruiken. Het is niet bekend wanneer de chip in productie gaat, maar tijdens ISC East heeft het de chip gedemonsteerd.

Bronnen: Centaur, Centaur (presentatieslides), SemiAccurate

« Vorig bericht Volgend bericht »
0
*