De opkomst van ‘wereldmodellen’: wanneer AI de werkelijkheid begint te begrijpen

5

Kunstmatige intelligentie heeft de afgelopen jaren snelle vooruitgang geboekt en beheerst taken als het genereren van tekst, het maken van afbeeldingen en zelfs het coderen van software. Maar de volgende stap gaat niet over het beschrijven van de wereld – het gaat over machines die leren hoe de wereld eigenlijk werkt. Deze impuls heeft geleid tot de ontwikkeling van ‘wereldmodellen’, AI-systemen die zijn ontworpen om de fysieke realiteit te simuleren en te voorspellen, een vermogen dat klaar staat om robotica, autonome systemen en zelfs de geneeskunde te transformeren.

Wat zijn wereldmodellen?

Het concept van wereldmodellen is niet nieuw en dateert uit de jaren vijftig, maar het dook rond 2018 weer op in AI-onderzoek en won in 2024 aan kracht met tools als Sora van OpenAI en Genie van Google DeepMind. In 2025 hebben Nvidia’s Cosmos, gekroond tot “Beste AI” op de CES, en Meta’s V-JEPA 2, die beweert de basisfysica zoals de zwaartekracht te begrijpen, het belang van het vakgebied nog verder versterkt.

In wezen overbruggen wereldmodellen de kloof tussen abstracte kennis en belichaamd begrip. Traditionele ‘basismodellen’ (zoals ChatGPT) leren van enorme datasets, maar missen directe ervaring. Ze kunnen de zwaartekracht beschrijven, maar voelen geen gewicht. Modellen van de World Foundation simuleren daarentegen fysieke omgevingen met behulp van video- en sensorische gegevens, waardoor AI resultaten kan voorspellen op basis van acties.

Van taal naar voorspelling

Grote taalmodellen (LLM’s) blinken uit in het verwerken van tekst, maar ze werken eerder op correlatie dan op causaliteit. Wereldmodellen verleggen de focus: in plaats van het volgende woord te voorspellen, voorspellen ze wat er volgende gebeurt nadat een actie is ondernomen. Dit kan zo simpel zijn als voorspellen hoe een object beweegt, of zo complex als een zelfrijdende auto die anticipeert op verkeerspatronen.

Zoals Eric Landau, CEO van AI-databedrijf Encord, stelt: wereldmodellen vervangen niet noodzakelijkerwijs LLM’s, maar lopen er naast als een parallel ontwikkelingstraject. LLM’s bevatten enige impliciete wereldkennis, maar deze is gefragmenteerd. Wereldmodellen streven naar een schonere, directere weergave van de werkelijkheid.

Hoe ze werken: twee benaderingen

Wereldmodellen werken op twee manieren: real-time generatie en simulatie in een vaste omgeving. De eerste creëert een dynamische wereld die reageert op interacties, net als een videogame. De tweede bouwt een vooraf gedefinieerde omgeving met vastgestelde regels, waardoor verkenning mogelijk is zonder de simulatie te destabiliseren.

Beide methoden zijn bedoeld om AI een dieper inzicht te geven in oorzaak en gevolg, waardoor het kan redeneren voordat het handelt, in plaats van stap voor stap te reageren. Dit is van cruciaal belang voor robots, autonome voertuigen en andere systemen die betrouwbare voorspellingen in fysieke ruimtes nodig hebben.

De toekomst van AI: robotica, medicijnen en meer

De vraag naar wereldmodellen groeit naarmate AI verder gaat dan chatbots en zich richt op meer onafhankelijke agenten. Training in de echte wereld is duur en riskant; simulaties bieden een veiliger, efficiënter alternatief. Robotica en autonoom rijden zijn voor de hand liggende toepassingen, maar de mogelijkheden reiken verder.

Onderzoekers voorspellen een snelle uitbreiding naar de geneeskunde, waar wereldmodellen een revolutie teweeg zouden kunnen brengen in de ontdekking van geneesmiddelen en de behandelplanning door complexe biologische interacties te simuleren. Ze zouden ook creatieve en educatieve hulpmiddelen kunnen transformeren, waardoor ontwerpers prototypes kunnen testen in meeslepende omgevingen en studenten kunnen communiceren met gesimuleerde systemen in plaats van er alleen maar over te lezen.

Risico’s en uitdagingen

Ondanks de belofte blijven er nog aanzienlijke hindernissen bestaan. Het nauwkeurig simuleren van de werkelijkheid is ongelooflijk moeilijk, en zelfs kleine fouten kunnen in de loop van de tijd verergeren. Rekenkracht is een grote beperking, omdat deze modellen enorme GPU-bronnen vereisen. Data-acquisitie is een ander knelpunt; sensorgegevens van hoge kwaliteit zijn veel moeilijker te verkrijgen dan de tekst die wordt gebruikt om LLM’s te trainen.

Naast technische uitdagingen waarschuwen experts voor mogelijk misbruik, waaronder bewapende autonome agenten en de maatschappelijke ontwrichting van wijdverbreide automatisering.

Zoals Nvidia-CEO Jensen Huang onlangs zei: AI is “de meest impactvolle technologie van onze tijd.” De ontwikkeling van wereldmodellen markeert een cruciale stap in de richting van AI die niet alleen informatie verwerkt, maar de wereld eromheen *begrijpt”, wat fundamentele vragen oproept over de toekomst van intelligentie en automatisering.