AI-technologie verandert wat we online zien en hoe we omgaan met de wereld. Van een foto halverwege de reis van de paus in een puffercoat tot modellen voor het leren van talen zoals ChatGPT, kunstmatige intelligentie dringt door in ons leven.
Het meer sinistere gebruik van AI-technologie, zoals een politieke desinformatiecampagne die nepartikelen verspreidt, betekent dat we onszelf voldoende moeten onderwijzen om de vervalsingen te herkennen. Dus hoe kun je zien of een artikel daadwerkelijk door AI gegenereerde tekst is?
Hoe weet u of ChatGPT dat artikel heeft geschreven?
Er bestaan momenteel meerdere methoden en hulpmiddelen om te bepalen of het artikel dat u leest door een robot is geschreven. Ze zijn niet allemaal 100% betrouwbaar en kunnen valse positieven opleveren, maar ze bieden wel een startpunt.
Een grote markering van door mensen geschreven tekst, althans voorlopig, is willekeur. Hoewel mensen verschillende stijlen en jargon gebruiken en vaak typefouten maken, maken AI-taalmodellen dit soort fouten zelden. Volgens MIT Technology Review “zit door mensen geschreven tekst vol typefouten en is ongelooflijk variabel”, terwijl door AI gegenereerde tekstmodellen zoals ChatGPT veel beter zijn in het maken van typefoutloze tekst. Natuurlijk heeft een goede tekstverwerker hetzelfde effect, dus je moet op meer letten dan alleen op correcte spelling.
Een andere indicator zijn interpunctiepatronen. Mensen zullen interpunctie willekeuriger gebruiken dan een AI-model zou kunnen. Door AI gegenereerde tekst bevat meestal ook meer verbindingswoorden zoals ‘de’, ‘het’ of ‘is’ in plaats van grotere, meer zelden gebruikte woorden, omdat grote taalmodellen werken door te voorspellen welk woord het meest waarschijnlijk daarna zal komen, niet met het bedenken iets dat goed zou klinken zoals een mens zou kunnen.
Dit is zichtbaar in het antwoord van ChatGPT op een van de aandelenvragen op de website van OpenAI. Op de vraag: “Kun je kwantumcomputing in eenvoudige bewoordingen uitleggen”, krijg je zinnen als: “Wat qubits bijzonder maakt, is dat ze in meerdere toestanden tegelijk kunnen bestaan, dankzij een eigenschap die superpositie wordt genoemd. Het is alsof een qubit tegelijkertijd zowel een 0 als een 1 kan zijn. ”
Er worden regelmatig korte, eenvoudige verbindingswoorden gebruikt, de zinnen zijn allemaal even lang en de alinea’s hebben allemaal een vergelijkbare structuur. Het eindresultaat is schrijven dat een beetje robotachtig klinkt en aanvoelt.
Kun je AI gebruiken om door AI gegenereerde tekst te detecteren?
Grote taalmodellen kunnen zelf worden getraind om door AI gegenereerd schrijven te herkennen. Door het systeem te trainen op twee sets tekst – een geschreven door AI en de andere geschreven door mensen – kan het model in theorie leren om AI-schrijven zoals ChatGPT te herkennen en te detecteren.
Onderzoekers werken ook aan watermerkmethoden om AI-artikelen en tekst te detecteren. Tom Goldstein, docent informatica aan de Universiteit van Maryland, werkt aan een manier om watermerken in AI-taalmodellen in te bouwen, in de hoop dat dit kan helpen bij het detecteren van door machines gegenereerd schrijven, zelfs als het goed genoeg is om menselijke willekeur na te bootsen.
Onzichtbaar voor het blote oog, zou het watermerk kunnen worden gedetecteerd door een algoritme, dat zou aangeven of het door een mens of door AI is gegenereerd, afhankelijk van hoe vaak het zich aan de regels voor watermerken hield of deze overtrad. Helaas is deze methode niet zo goed getest op latere modellen van ChatGPT.
Tools om te controleren of een artikel is geschreven door ChatGPT
U kunt online meerdere tools voor kopiëren en plakken vinden waarmee u kunt controleren of een artikel door AI is gegenereerd. Velen van hen gebruiken taalmodellen om de tekst te scannen, inclusief ChatGPT-4 zelf.
Niet-detecteerbare AI brengt zichzelf bijvoorbeeld op de markt als een hulpmiddel om ervoor te zorgen dat uw AI-schrijven niet te onderscheiden is van dat van een mens. Kopieer en plak de tekst in het venster en het programma vergelijkt het met de resultaten van andere AI-detectietools zoals GPTZero om er een waarschijnlijkheidsscore aan toe te kennen. Het controleert in feite of acht andere AI-detectoren zouden denken dat uw tekst door een robot is geschreven.
Originaliteit is een ander hulpmiddel, gericht op grote uitgevers en producenten van inhoud. Het beweert nauwkeuriger te zijn dan andere op de markt en gebruikt ChatGPT-4 om door AI geschreven tekst te helpen detecteren. Andere populaire controletools zijn:
- GPTZero
- Kopieerlekken
- auteur
De meeste van deze tools geven je een procentuele waarde, zoals 96% mens en 4% AI, om te bepalen hoe waarschijnlijk het is dat de tekst door een mens is geschreven. Als de score 40-50% AI of hoger is, is het stuk waarschijnlijk door AI gegenereerd.
Terwijl ontwikkelaars eraan werken om deze tools beter te maken in het detecteren van door AI gegenereerde tekst, is geen van hen volledig nauwkeurig en kan menselijke inhoud ten onrechte markeren als gegenereerd door AI. Er is ook bezorgdheid dat, aangezien grote taalmodellen zoals GPT-4 zo snel verbeteren, detectiemodellen constant een inhaalslag maken.
Train je hersenen om AI te vangen
Naast het gebruik van tools, kun je jezelf trainen om door AI gegenereerde inhoud te vangen. Het vergt oefening, maar na verloop van tijd kun je er beter in worden.
Daphne Ippolito, een senior onderzoekswetenschapper bij Google’s AI-divisie Google Brain, heeft een spel gemaakt met de naam Real Or Fake Text (ROFT) dat je kan helpen menselijke zinnen te scheiden van robotachtige zinnen door je geleidelijk te trainen om op te merken wanneer een zin er niet helemaal goed uitziet .
Een veelvoorkomend kenmerk van AI-tekst, volgens Ippolito, zijn onzinnige uitspraken als “het duurt twee uur om een kop koffie te zetten”. De game van Ippolito is grotendeels gericht op het helpen van mensen bij het opsporen van dat soort fouten. In feite zijn er meerdere gevallen geweest van een AI-schrijfprogramma dat met volledig vertrouwen onnauwkeurige feiten vermeldde – je zou het waarschijnlijk ook niet moeten vragen om je wiskundeopdracht te doen, omdat het numerieke berekeningen niet zo goed lijkt aan te kunnen.
Op dit moment zijn dit de beste detectiemethoden die we hebben om tekst op te vangen die is geschreven door een AI-programma. Taalmodellen worden steeds beter met een snelheid die de huidige detectiemethoden vrij snel achterhaald maakt, waardoor we, zoals Melissa Heikkilä schrijft voor MIT Technology Review, in een wapenwedloop terechtkomen.