Google Research onthult op 4 mei 2023 een revolutionair AI-model: MaMMUT. Dit model kan de manier waarop computers taal en afbeeldingen begrijpen naar een hoger niveau tillen.
MaMMUT kan automatisch bijschriften voor afbeeldingen genereren, antwoorden geven op vragen over video’s en objecten in afbeeldingen vinden en herkennen. Maar wat MaMMUT echt bijzonder maakt, is dat het verschillende taken tegelijkertijd kan uitvoeren, waaronder het lokaliseren van objecten in een afbeelding en het genereren van bijschriften. Dit maakt het model zeer efficiënt en bespaart tijd en rekenkracht.
MaMMUT is getest op verschillende datasets en presteerde beter dan eerdere modellen. Het biedt mogelijkheden om betere chatbots te bouwen en computers menselijke taal beter te laten begrijpen. De onderzoekers hopen dat MaMMUT in de toekomst kan worden ingezet in diverse toepassingen om computers nog slimmer te maken en de interactie tussen mens en machine te verbeteren.
MaMMUT vs. ChatGPT
Hoewel MaMMUT en ChatGPT beide AI-modellen zijn die taal en afbeeldingen begrijpen, hebben ze elk hun eigen specialiteit. Waar MaMMUT gericht is op multimodale taken, is GPT voornamelijk gericht op taalverwerkingstaken. Het is getraind om menselijke taal te lezen en begrijpen, en kan tekst genereren op basis van een gegeven prompt.
Het verschil in specialiteit betekent dat beide modellen unieke toepassingsgebieden en doelen hebben. MaMMUT kan bijvoorbeeld gebruikt worden om betere chatbots te bouwen en computers te helpen menselijke taal beter te begrijpen. GPT daarentegen kan ingezet worden voor taalverwerkingstaken zoals vertalingen en tekstgeneratie.
Vertrek topman Google
Google’s lancering van het MaMMUT-model komt kort na het vertrek van de topman in AI, Geoffrey Hinton, bij het bedrijf. Hinton heeft onlangs ontslag genomen omdat hij zijn bezorgdheid wil uiten over de gevaren van AI. Hij maakt zich zorgen over de concurrentiestrijd die momenteel gaande is en vreest dat dit kan leiden tot een gebrek aan zorgvuldigheid bij de ontwikkeling van AI-technologie. Hoewel het niet duidelijk is of het vertrek van Hinton rechtstreeks verband houdt met de lancering van het MaMMUT-model, benadrukt het belang van het proactief benaderen van de uitdagingen en risico’s die gepaard gaan met de ontwikkeling en inzet van AI-technologie.
Verwachtingen Google Mammut
MaMMUT kan de manier waarop computers taal en afbeeldingen begrijpen verbeteren en onder andere automatisch bijschriften voor afbeeldingen genereren. Het bijzondere aan het MaMMUT-model is dat het verschillende taken tegelijkertijd kan uitvoeren, zoals het lokaliseren van objecten in een afbeelding en het genereren van bijschriften. Dit kan computers helpen menselijke taal beter te begrijpen en slimmere chatbots te bouwen.
In de toekomst hopen de onderzoekers het model te kunnen gebruiken in verschillende toepassingen om computers slimmer te maken en de interactie tussen mensen en machines te verbeteren. We zullen de mogelijkheden van MaMMUT verder ontdekken en jullie ervan op de hoogte houden.
Bronnen
- Titel: MaMMUT: A Simple Vision-Encoder Text Decoder Transformer for Multimodal Tasks Auteur: Google AI Blog Datum: 4 mei 2023 URL: https://ai.googleblog.com/2023/05/mammut-simple-vision-encoder-text.html?m=1&s=09