Onderzoek van het Nederlandse bedrijf BrainCreators en de Universiteit van Amsterdam hebben een nieuw mechanisme voor het herkennen van bepaalde videobeelden met behulp van AI ontwikkeld. Het moet met name nuttig zijn om het trainen van AI's een stuk efficiënter te laten verlopen.
De nieuwe techniek heet Video Cross-Stream Prototypical Contrasting (ViCC) en is bij uitstek geschikt voor het automatisch herkennen van bepaalde gebeurtenissen in video's, het efficiënt doorzoeken van grote hoeveelheden data en het onderscheppen van afwijkende data. Dit kan met beperkte ondersteuning van mensen, of zelfs helemaal zonder.
In een proefschrift getiteld Self-supervised Video Representation Learning with Cross-Stream Prototypical Contrasting beschrijven de wetenschappers hoe kunstmatige intelligentie met behulp van rgb-informatie en de beweging van het beeld meer informatie uit de beelden kan onttrekken.
Het werkt beter dan het gangbare instance-level contrastive learning, zo is er geen extra vergelijkingsmateriaal nodig en is het sneller. Het gaat slechts om een verbetering in snelheid van een paar procent, maar de verbeteringen in accuraatheid zijn veel groter. De onderzoekers noemen getallen als 90,5% versus 62,2% voor HMDB51. ViCC kan volgens de onderzoekers worden toegepast in bestaande visuele herkenningsmodellen, zoals BrainCreators' Ara en Inspech.
Bron: arXiv-database