
Nanoporiënsequencing met hoge doorvoer van XNA’s. Credit: Natuurcommunicatie (2025). DOI: 10,1038/s41467-025-62347-z
Een onderzoeksteam onder leiding van het A*STAR Genome Institute of Singapore (A*STAR GIS) heeft een methode ontwikkeld om nauwkeurig en efficiënt DNA te lezen dat niet-standaard basen bevat – een taak die ooit als te complex werd beschouwd voor conventionele DNA-sequencers. Hun werk, gepubliceerd in Natuurcommunicatiecombineert nanoporiesequencing met kunstmatige intelligentie (AI) om deze extra “letters” met hoge snelheid en nauwkeurigheid te decoderen.
De uitdaging: het decoderen van DNA, de verborgen taal van de natuur
DNA is de handleiding van de natuur, opgebouwd uit vier standaard ‘letters’ of basen A, T, C en G. Wetenschappers hebben zich lang voorgesteld dit genetische alfabet uit te breiden door nieuwe ‘letters’ toe te voegen, bekend als niet-canonieke basen (NCB’s). Deze NCB’s kunnen van nature voorkomen in sommige virussen of in het laboratorium worden gecreëerd, en ze hebben het potentieel om nieuwe manieren te ontsluiten voor het ontwerpen van moleculen, materialen en biologische systemen.
Er werden echter DNA-sequencing-machines gebouwd om alleen de vier standaardbases te herkennen. Omdat ze moeite hebben om nieuwe te detecteren of te decoderen, zijn wetenschappers er niet in geslaagd hun potentieel ten volle te benutten om preciezere medicijnen te ontwikkelen, kunstmatige genomen te ontwikkelen voor duurzame chemische productie, en programmeerbare materialen en apparaten op nanoschaal te ontwerpen voor toekomstige technologieën.
“Ons vermogen om snel een stuk tekst te lezen hangt grotendeels af van hoe bekend we zijn met de gebruikte woordenschat”, zegt dr. Mauricio Lisboa Perez, wetenschapper bij A*STAR GIS en eerste auteur van het onderzoek. “Op dezelfde manier moet een AI-model, om DNA snel te kunnen lezen, genoeg voorbeelden van elke base hebben gezien. Niet-canonieke bases zijn zeldzaam en moeilijker te produceren, dus moesten we creatieve manieren ontwerpen om voldoende voorbeelden te genereren waar ons AI-model van kan leren.”
De oplossing: AI gebruiken om DNA te vertalen met niet-standaard basen
Het team creëerde een grote bibliotheek van kunstmatig DNA met zowel standaard als niet-standaard basen in verschillende combinaties, en gebruikte vervolgens nanoporie-sequencing om de unieke elektrische signalen vast te leggen die werden geproduceerd toen elke base door microscopisch kleine poriën ging.
Omdat de gegevens vaak luidruchtig en onvolledig waren, ontwikkelden de onderzoekers een AI-gestuurde aanpak die iteratief kon leren en verbeteren, waardoor de voorspellingen in de loop van de tijd konden worden verfijnd. Ze verbeterden ook het leerproces van het AI-model door bestaande signaalgegevens op creatieve wijze te herschikken om meer combinaties weer te geven.
Deze adaptieve methode stelde de AI in staat het afzonderlijke patroon van elke base nauwkeurig te herkennen, waardoor de sequencer nieuwe DNA-letters direct kon lezen.
Terwijl andere onderzoeksgroepen vergelijkbare uitdagingen hebben onderzocht, is deze studie de eerste die een DNA-sequencer demonstreert die niet-standaard basen op grote schaal direct en betrouwbaar kan identificeren met behulp van AI, waardoor belangrijke knelpunten zoals beperkte trainingsgegevens worden overwonnen.
“Het nauwkeurig kunnen identificeren van deze nieuwe bases op grote schaal geeft ons een veel rijkere woordenschat voor het schrijven en lezen van biologische informatie”, zegt Dr. Niranjan Nagarajan, Associate Director, AI & Compute bij A*STAR GIS en senior auteur van het onderzoek. “Het is net als het leren herkennen van nieuwe letters, waardoor we veel meer woorden en betekenissen in de taal van het leven kunnen begrijpen.”
Transformatief potentieel van de methode
Deze doorbraak zou innovatie op meerdere gebieden kunnen stimuleren:
- Gezondheidszorg en therapieën: Het nauwkeurig lezen en analyseren van niet-standaard basen neemt een belangrijk knelpunt weg bij de ontwikkeling van op DNA en RNA gebaseerde behandelingen, waardoor de weg wordt vrijgemaakt voor nieuwe medicijnen en diagnostiek.
- Geavanceerde materialen en biotechnologie: niet-standaard bases kunnen dienen als nieuwe bouwstenen voor nanostructuren en nanorobots, wat kan leiden tot doorbraken in de geneeskunde, productie en duurzame chemische productie.
- Gegevens- en informatieopslag: Het coderen van informatie met behulp van uitgebreide DNA-alfabetten kan de gegevensopslag betaalbaarder en energie-efficiënter maken, waardoor mogelijk de ecologische voetafdruk van datacenters wordt verkleind.
De onderzoekers zijn van plan hun werk uit te breiden om meer niet-standaard basen in virussen te ontdekken en het vermogen van het AI-model om deze te detecteren te verbeteren.
“We zijn enthousiast over deze nieuwe DNA-sequencing-methode en de mogelijkheden die deze met zich meebrengt”, aldus Dr. Wan Yue, uitvoerend directeur bij A*STAR GIS.
“Werken met een uitgebreid DNA-alfabet zal meer mogelijkheden creëren voor wetenschappers om nieuwe therapieën te ontwikkelen, nieuwe organismen die chemicaliën op milieugebied produceren, en nieuwe programmeerbare materialen voor nanostructuren en nanorobots. Deze innovaties kunnen wetenschappelijke ontdekkingen bevorderen, economische waarde creëren en uiteindelijk levens verbeteren.”
Meer informatie:
Mauricio Perez et al., Directe deconvolutie met hoge doorvoer van niet-canonieke basen via nanopore-sequencing en bootstrapped learning, Natuurcommunicatie (2025). DOI: 10,1038/s41467-025-62347-z
Tijdschriftinformatie:
Natuurcommunicatie
Aangeboden door Agentschap voor Wetenschap, Technologie en Onderzoek (A*STAR), Singapore