U klikt op een verwijzing op Wikipedia, alleen om te ontdekken dat de URL is verbroken. Het is frustrerend, maar het zou nu minder vaak moeten gebeuren dankzij The Internet Archive.
Websites gaan dood, en zelfs als ze dat niet doen, worden er soms artikelen en pagina’s verwijderd. Dat is een probleem voor Wikipedia, dat gedeeltelijk aan geloofwaardigheid opbouwt door andere websites te citeren. Een driejarige inspanning van The Internet Archive betekent dat 9 miljoen eerder verbroken Wikipedia-citaten verwijzen naar de Wayback Machine van het archief, die toegang biedt tot bronmateriaal dat anders moeilijk zou zijn voor gebruikers om op te sporen.
Hier is Mark Graham, die in een officiële blogpost op Internet Archive schrijft over het programma:
Al meer dan 5 jaar archiveert het internetarchief bijna elke URL waarnaar wordt verwezen in bijna 300 wikipedia-sites zodra deze links worden toegevoegd of gewijzigd met een snelheid van ongeveer 20 miljoen URL’s per week.
En de afgelopen 3 jaar hebben we een softwarerobot met de naam IABot op 22 Wikipedia-taaledities uitgevoerd, op zoek naar verbroken links (URL’s die een ‘404’ of ‘Pagina niet gevonden’ retourneren). Wanneer verbroken koppelingen worden ontdekt, zoekt IABot naar archieven in de Wayback Machine en andere webarchieven om ze te vervangen. Door links te herstellen, blijft Wikipedia accuraat en verifieerbaar en voldoet het dus aan een van de drie kernbeleidsregels van Wikipedia: ‘Verifieerbaarheid’.
De bot repareerde 6 miljoen links door naar het archief te verwijzen, terwijl Wikipedia-editors naar 3 miljoen meer linken. Het is een echte service voor internetgebruikers, die nu referenties kunnen controleren die anders verloren zouden gaan. Het is een beetje eng dat een non-profitorganisatie dit werk moet doen, maar ik ben blij dat iemand dat is.