Nieuw algoritme maakt AI voor CPU's tot 15 keer sneller dan AI op GPU's

16 reacties

Onderzoekers van het Texaanse Rice University en Intel hebben op de Conference on Machine Learning and Systems (MLSys) onthuld dat ze artificial intelligence-software tot 15 keer sneller kunnen laten werken op reguliere cpu's.

Dat is opvallend, want zeker voor machine learning ontwikkelt de hardwarewereld steeds meer zeer gespecialiseerde processors. Cpu's staan er niet om bekend de snelste oplossing te zijn voor deze toepassing, maar volgens de onderzoekers zit er nog meer dan genoeg rek in.

Volgens Anshumali Shrivastava van Rice's Brown School of Engineering zit de grootste belemmering in het gebruik van AI hem in de softwarekosten van AI-modellen. Hij zegt dat bedrijven miljoenen dollars per week besteden aan het trainen van hun modellen en om hun workloads te optimaliseren. Dat komt omdat de gehele AI-industrie is gefixeerd op één soort vooruitgang: matrixvermenigvuldiging. Er wordt ook al specialistische hard- en software ontworpen voor specifieke takken binnen kunstmatige intelligentie. Shrivastava verklaarde tegenover Tech Xplore dat het wellicht nuttiger is om opnieuw een algoritme te ontwikkelen.

Op de MLSys een jaar geleden heeft het team het slide-algoritme (sub-linear deep learning engine) onthuld, dat speciaal geschikt is om efficiënt op cpu's te werken. Samen met Intel toonden ze dat een op cpu's gebaseerd systeem beter moet kunnen presteren dan een vergelijkbaar systeem op basis van Nvidia's Tesla V100. De software is gebaseerd op hash table-based acceleration, dat al in staat is om beter te presteren dan gpu's. De prestaties van cpu's verbeteren echter ook. Volgens de whitepaper zijn de gebruikte cpu's Intel Cooper Lake- en Cascade Lake-Xeons, die beide avx-512 ondersteunen. Als gpu werden wederom Tesla V100-gpu's gebruikt.

Als je niet gefixeerd bent op matrixvermenigvuldigingen, dan kan een cpu-systeem zo'n vier tot vijftien keer sneller zijn. Daar komt bij dat als de server niet bezig is met bepaalde AI-taken, de server niet per definitie staat te verstoffen. Cpu's kunnen immers voor bijna alles ingezet worden. Bovendien zet Intel met de gloednieuwe derde generatie Xeon Scalable-chips hoog in op artificial intelligence.

Bronnen: MLSys (paper), Tech Xplore


3 besproken producten

Vergelijk alle producten

Vergelijk   Product Prijs
PNY Tesla V100 16GB

PNY Tesla V100 16GB

  • Nvidia Tesla V100
  • 16384 MB
Niet verkrijgbaar
PNY Tesla V100 32GB

PNY Tesla V100 32GB

  • Nvidia Tesla V100
  • 32768 MB
Niet verkrijgbaar
PNY Tesla V100S 32GB

PNY Tesla V100S 32GB

  • Nvidia Tesla V100
  • 32768 MB

€ 11.505,70

1 winkel
« Vorig bericht Volgend bericht »
0
*