Waarom heeft kunstmatige intelligentie hallucinaties?

Kunstmatige intelligentie (AI) kan antwoorden produceren die zelfverzekerd, gedetailleerd en logisch klinken, zelfs als de informatie onjuist is. Onderzoekers noemen dit gedrag ‘hallucinatie’. Een hallucinatie vindt plaats wanneer een kunstmatig intelligentiesysteem informatie genereert die niet overeenkomt met de werkelijkheid, geverifieerde feiten of de invoergegevens.

Waarom heeft kunstmatige intelligentie hallucinaties?
Modellen voor kunstmatige intelligentie geven verrassend vaak verkeerde antwoorden, vooral op complexe, zeldzame of zeer feitelijke vragen.

Mogelijk zie je hallucinaties in chatbots, zoekassistenten, apps voor het genereren van afbeeldingen, codeertools en stemassistenten. Een chatbot kan een wetenschappelijk onderzoek bedenken dat nooit heeft bestaan. Een app voor het genereren van afbeeldingen kan een persoon met zes vingers creëren. Een codeerassistent kan computercode schrijven die er correct uitziet, maar mislukt wanneer u deze uitvoert.

Hallucinaties op het gebied van kunstmatige intelligentie gebeuren omdat moderne systemen patronen voorspellen in plaats van de waarheid op dezelfde manier te begrijpen als mensen. Het probleem komt voort uit de manier waarop modellen voor kunstmatige intelligentie leren, hoe ontwikkelaars ze testen, hoe trainingsgegevens zich gedragen en hoe op waarschijnlijkheid gebaseerde voorspellingen werken.

Hoe zien AI-hallucinaties eruit?

Hallucinaties op het gebied van kunstmatige intelligentie kunnen in vele vormen voorkomen.

Verzonnen feiten

Een chatbot kan het volgende bedenken:

  • Valse onderzoekspapieren
  • Valse historische gebeurtenissen
  • Niet-bestaande wetten
  • Denkbeeldige bedrijfsleiders
  • Verkeerd medisch advies.

Advocaten dienden in verschillende rechtszaken bijvoorbeeld juridische stukken in die valse gerechtelijke uitspraken bevatten die waren gegenereerd door kunstmatige intelligentiesystemen. De chatbot produceerde casuscitaten die er authentiek uitzagen, maar niet bestonden.

Onjuiste samenvattingen

Een AI-model kan een document verkeerd samenvatten en tegelijkertijd overtuigend klinken. Microsoft-onderzoekers hebben onlangs ontdekt dat geavanceerde taalmodellen de inhoud van documenten tijdens lange workflows kunnen beschadigen of vervormen. Sommige systemen beschadigden tijdens het testen tot 25% van de inhoud.

Visuele hallucinaties

Afbeeldingsgenerator-apps soms:

  • Voeg extra ledematen toe
  • Creëer onleesbare tekst
  • Produceer onmogelijke reflecties
  • Vervorm de menselijke anatomie.

U merkt dit probleem mogelijk vooral bij wijzers, tanden, klokken of complexe achtergronden, omdat deze details nauwkeurige ruimtelijke relaties vereisen.

Logische hallucinaties

Sommige AI-modellen produceren antwoorden die tegenstrijdigheden of onmogelijke redeneerstappen bevatten. Een systeem kan wiskunde verkeerd uitleggen terwijl het de uitleg met volledig vertrouwen presenteert.

Redenen waarom kunstmatige intelligentie hallucinaties heeft

1. Kunstmatige intelligentie voorspelt patronen in plaats van de waarheid te verifiëren

De belangrijkste reden achter hallucinaties betreft het kernontwerp van grote taalmodellen.

Moderne taalmodellen voorspellen het volgende woord in een reeks. Ze ‘kennen’ de waarheid niet rechtstreeks. Ze schatten welk woordpatroon hoogstwaarschijnlijk op de voorgaande woorden volgt.

Wanneer u bijvoorbeeld vraagt:

“Wie heeft de telefoon uitgevonden?”

Het model berekent kansen op basis van patronen die uit enorme hoeveelheden tekst zijn geleerd. Als de trainingsgegevens ‘Alexander Graham Bell’ sterk associëren met ‘de telefoon heeft uitgevonden’, levert het model dat antwoord op.

Wanneer het model echter onzekere, zeldzame, onvolledige of tegenstrijdige informatie tegenkomt, probeert het systeem nog steeds het patroon voort te zetten.

Het systeem stopt niet vanzelf en zegt: ‘Ik weet het niet.’

Onderzoekers van OpenAI legden uit dat hallucinaties deels ontstaan ​​doordat taalmodellen de voorspelling van het volgende woord optimaliseren in plaats van feitelijke verificatie.

2. Trainen beloont raden

Een andere belangrijke oorzaak komt voort uit de manier waarop ontwikkelaars modellen trainen en evalueren.

De meeste benchmarktests belonen correcte antwoorden, maar bestraffen zelfverzekerde foute antwoorden niet krachtig. Door deze scoringsmethode leren kunstmatige intelligentiesystemen dat gissen vaak betere scores oplevert dan het toegeven van onzekerheid.

Onderzoekers vergeleken dit gedrag met studenten die een moeilijk meerkeuze-examen afleggen. Een leerling die raadt, krijgt soms toevallig punten. Een leerling die vragen blanco laat, krijgt altijd nul punten.

Dezelfde druk treft kunstmatige-intelligentiesystemen.

Volgens onderzoek gepubliceerd door OpenAI Research verminderden sommige nieuwere modellen hallucinaties door vaker onzekere vragen te weigeren. Uit dit onderzoek kwam een ​​opvallend verschil naar voren:

  • Eén model produceerde 75% van de tijd foute antwoorden op een moeilijke benchmark
  • Een ander model antwoordde vaker ‘Ik weet het niet’ en verminderde het aantal fouten tot 26%.

Dit onderzoek suggereert dat evaluatiesystemen zelf hallucinaties in de hand werken.

3. Trainingsgegevens bevatten fouten en tegenstrijdigheden

Kunstmatige intelligentiesystemen leren van enorme datasets die worden verzameld uit:

  • Websites
  • Boeken
  • Artikelen
  • Forums
  • Codeopslagplaatsen
  • Sociale media.

Veel van deze bronnen bevatten:

  • Valse beweringen
  • Verouderde informatie
  • Vooringenomen meningen
  • Tegenstrijdige feiten
  • Satire
  • Spam
  • Schrijven van lage kwaliteit.

Het model absorbeert statistische relaties uit al deze informatie.

Als conflicterende informatie herhaaldelijk voorkomt in trainingsgegevens, kan het model deze informatiefragmenten combineren tot een verzonnen antwoord.

Bijvoorbeeld:

  • Eén artikel bevat een onjuiste datum
  • Een ander artikel vermeldt een soortgelijke gebeurtenis
  • Het model kan beide patronen samenvoegen tot een valse verklaring.

Omdat het model geen menselijk inzicht of feitencontrolevermogen bezit, kan het betrouwbare informatie niet altijd scheiden van onbetrouwbare informatie.

4. Zeldzame feiten zorgen voor grote problemen

Kunstmatige intelligentiesystemen presteren het beste op basis van veelvoorkomende patronen die tijdens de training vaak voorkomen.

Zeldzame feiten zorgen voor veel grotere problemen.

Bijvoorbeeld:

  • Beroemde historische gebeurtenissen verschijnen miljoenen keren online
  • De verjaardag van een burgemeester van een kleine stad kan maar één keer voorkomen.

Onderzoekers leggen uit dat zeldzame feiten zich vanuit het perspectief van het model vrijwel willekeurig gedragen. Het systeem kan deze details niet op betrouwbare wijze generaliseren omdat er beperkte voorbeelden in de trainingsgegevens voorkomen.

Dit probleem wordt vooral ernstig op de volgende gebieden:

  • Geneesmiddel
  • Wet
  • Wetenschappelijk onderzoek
  • Technische techniek
  • Lokale bedrijfsinformatie
  • Recente nieuwsgebeurtenissen.

5. AI-modellen proberen vloeiend en behulpzaam te klinken

Ontwikkelaars trainen chatbots om natuurlijk, gemoedelijk en nuttig te klinken.

Deze training creëert een ander probleem.

Als een model vaak zou antwoorden: “Ik weet het niet”, zouden veel gebruikers dit systeem als frustrerend of onintelligent beschouwen.

Als gevolg hiervan optimaliseren ontwikkelaars systemen vaak voor:

  • Vlot gesprek
  • Gedetailleerde uitleg
  • Snelle reacties
  • Vertrouwen
  • Gebruikerstevredenheid.

Helaas kan vloeiende taal onjuiste informatie verbergen.

Verschillende onderzoekers beweren nu dat hallucinaties een bijwerking zijn van systemen die zijn geoptimaliseerd voor overtuigende communicatie in plaats van voor voorzichtige onzekerheid.

6. Kunstmatige intelligentie ontbeert gefundeerd begrip

Mensen verbinden taal met:

  • Fysieke ervaringen
  • Emoties
  • Zintuiglijke input
  • Interactie in de echte wereld.

Grote taalmodellen ervaren de werkelijkheid niet direct.

Een mens begrijpt ‘vuur’ deels door:

  • Warmte
  • Gevaar
  • Visueel geheugen
  • Fysieke interactie.

Een taalmodel ziet alleen woordpatronen die verband houden met ‘vuur’.

Vanwege deze beperking kan het systeem taal genereren die betekenisvol lijkt zonder de onderliggende realiteit echt te begrijpen.

Sommige onderzoekers omschrijven dit probleem als een gebrek aan ‘gronding’.

7. Hallucinaties nemen toe bij langere taken

Uit recent onderzoek blijkt dat hallucinaties vaak erger worden tijdens lange werkprocessen.

Wanneer gesprekken langer worden:

  • Eerdere fouten planten zich voort
  • Kleine onnauwkeurigheden stapelen zich op
  • Context wordt moeilijker te volgen
  • Interne tegenstellingen nemen toe.

Microsoft-onderzoekers ontdekten dat de prestaties achteruit gingen naarmate de complexiteit en lengte van documenten toenamen.

U kunt dit probleem opmerken wanneer:

  • Lange rapporten genereren
  • Schrijven van grote softwareprogramma’s
  • Het voeren van uitgebreide onderzoeksgesprekken
  • Lange documenten samenvatten.

8. Problemen met het ophalen van informatie kunnen hallucinaties veroorzaken

Sommige systemen verbinden taalmodellen met externe databases of zoekmachines. Ontwikkelaars noemen deze aanpak retrieval-augmentedgeneration.

Deze methode vermindert hallucinaties, maar elimineert ze niet.

Er doen zich nog steeds problemen voor wanneer:

  • Het zoeksysteem haalt irrelevante informatie op
  • De opgehaalde informatie bevat fouten
  • Het model interpreteert opgehaalde gegevens verkeerd
  • De database bevat geen bijgewerkte feiten.

Als het zoeksysteem bijvoorbeeld twee conflicterende artikelen vindt, kan het model beide combineren tot een misleidend antwoord.

9. Versterkend leren kan onbedoeld de hallucinaties vergroten

Ontwikkelaars verfijnen modellen vaak met behulp van menselijke feedback.

Menselijke recensenten belonen doorgaans antwoorden die nuttig, volledig, beleefd of zelfverzekerd overkomen.

Het is echter mogelijk dat reviewers niet elke feitelijke claim zorgvuldig verifiëren.

Dit trainingsproces kan modellen onbedoeld leren prioriteit te geven aan overtuigende communicatie boven strikte nauwkeurigheid.

Verschillende onderzoekers en gemeenschapsdiscussies benadrukken dit probleem herhaaldelijk.

Waarom zien hallucinaties er soms extreem overtuigend uit?

Hallucinaties op het gebied van kunstmatige intelligentie lijken vaak geloofwaardig omdat taalmodellen uitblinken in grammatica, structuur, toon, stijlimitatie en contextuele flow.

Het systeem kan produceren:

  • Academische taal
  • Technische terminologie
  • Professionele opmaak
  • Gedetailleerde citaten
  • Logische overgangen.

Zelfs volledig verzonnen informatie kan gezaghebbend klinken.

Deze combinatie zorgt voor een gevaarlijk effect:

  • Hoge vloeiendheid
  • Hoog vertrouwen
  • Lage feitelijke betrouwbaarheid.

Mensen vertrouwen vaak automatisch op vloeiend taalgebruik, vooral als het antwoord gedetailleerd en professioneel overkomt.

Hallucinaties zullen wellicht nooit helemaal verdwijnen

Sommige onderzoekers beweren nu dat hallucinaties niet volledig kunnen worden geëlimineerd in op waarschijnlijkheid gebaseerde taalsystemen.

In een onderzoekspaper uit 2025 werd betoogd dat er altijd een afweging kan bestaan ​​tussen creativiteit, volledigheid, vertrouwen, nauwkeurigheid en informatiedekking.

Als ontwikkelaars een model dwingen alle mogelijke hallucinaties te vermijden, kan dat model overdreven voorzichtig worden en veel legitieme vragen weigeren.

Als ontwikkelaars gedetailleerde, nuttige antwoorden aanmoedigen, kan het risico op hallucinaties toenemen.

Dit evenwicht creëert een moeilijk technisch probleem.

De manier waarop bedrijven hallucinaties verminderen

Bedrijven op het gebied van kunstmatige intelligentie gebruiken verschillende strategieën om hallucinaties te verminderen.

Betere systemen voor het ophalen van informatie

Ontwikkelaars verbinden modellen met:

  • Zoekmachines
  • Geverifieerde databases
  • Interne bedrijfsdocumenten
  • Wetenschappelijke archieven.

Deze aardingsmethode geeft modellen toegang tot actuele feitelijke informatie.

Schatting van het vertrouwen

Sommige systemen proberen de onzekerheid te meten voordat ze antwoorden.

Een model kan:

  • Weiger onzekere vragen
  • Stel vervolgvragen
  • Geef vertrouwenswaarschuwingen weer.

Verbetering van de opleiding

Ontwikkelaars trainen steeds vaker modellen om onzekerheid toe te laten, bronnen te citeren, uitkomsten te verifiëren en redeneerstappen te gebruiken.

Menselijk toezicht

Veel organisaties vereisen nog steeds dat mensen juridische documenten, medische aanbevelingen, financiële analyses en onderzoekssamenvattingen beoordelen.

Menselijk toezicht blijft van groot belang omdat hallucinaties toch onverwacht kunnen optreden.

Je moet kunstmatige intelligentie behandelen als een assistent, niet als een perfecte autoriteit

Kunstmatige intelligentiesystemen kunnen opmerkelijke resultaten opleveren:

  • Hulp bij het schrijven
  • Hulp bij coderen
  • Vertaling
  • Onderzoeksondersteuning
  • Samenvatting
  • Brainstormen.

U moet belangrijke informatie echter nog steeds onafhankelijk verifiëren.

U moet vooral voorzichtig zijn bij het gebruik van kunstmatige intelligentie op deze gebieden:

  • Geneesmiddel
  • Wet
  • Financiën
  • Engineering
  • Academisch onderzoek
  • Veiligheidskritieke beslissingen.

Hallucinaties gebeuren omdat kunstmatige intelligentiesystemen statistisch waarschijnlijke taalpatronen genereren in plaats van de objectieve waarheid rechtstreeks te verifiëren. Deze systemen kunnen kennis buitengewoon goed imiteren, maar imitatie staat niet altijd gelijk aan nauwkeurigheid.

Onderzoekers blijven de betrouwbaarheid, kalibratie en verificatiemethoden verbeteren. Het aantal hallucinaties is in veel nieuwere systemen afgenomen, maar dit probleem is nog steeds een belangrijke beperking van moderne kunstmatige intelligentie.

Nieuwste artikelen

Gerelateerde artikelen