
Een dubbelstrengs DNA-fragment. Krediet: Vcpmartin/Wikimedia/CC BY-SA 4.0
Stel je voor dat Bach’s “Cello Suite nr. 1” wordt gespeeld op een DNA-streng.
Dit scenario is niet zo onmogelijk als het lijkt. DNA is te klein om een ritmische slag of glijdende boogpees te weerstaan en is een krachtpatser voor het opslaan van audiobestanden en allerlei andere media.
“DNA is het oorspronkelijke gegevensopslagsysteem van de natuur. We kunnen het gebruiken om alle soorten gegevens op te slaan: afbeeldingen, video, muziek – alles”, zegt Kasra Tabatabaei, een onderzoeker aan het Beckman Institute for Advanced Science and Technology en een co-auteur van deze studie.
Door de moleculaire samenstelling van DNA uit te breiden en een nauwkeurige nieuwe sequentiemethode te ontwikkelen, kon een multi-institutioneel team de dubbele helix transformeren in een robuust, duurzaam gegevensopslagplatform.
De krant van het team verscheen in Nano-letters in februari 2022.
In het tijdperk van digitale informatie voelt iedereen die dapper genoeg is om door het dagelijkse nieuws te navigeren het wereldwijde archief met de dag zwaarder worden. Papieren dossiers worden steeds vaker gedigitaliseerd om ruimte te besparen en informatie te beschermen tegen natuurrampen.
Van wetenschappers tot influencers op sociale media, iedereen die informatie heeft om op te slaan, kan profiteren van een veilige, duurzame datalockbox – en de dubbele helix past precies.
“DNA is een van de beste opties, zo niet de beste optie, om vooral archiefgegevens op te slaan”, zegt Chao Pan, een afgestudeerde student aan de University of Illinois Urbana-Champaign en een co-auteur van deze studie.
Zijn lange levensduur kan alleen worden geëvenaard door duurzaamheid, DNA is ontworpen om de zwaarste omstandigheden op aarde te doorstaan - soms tienduizenden jaren – en blijft een levensvatbare gegevensbron. Wetenschappers kunnen gefossiliseerde strengen sequensen om genetische geschiedenissen bloot te leggen en lang verloren landschappen nieuw leven in te blazen.
Ondanks zijn kleine gestalte, lijkt DNA een beetje op de beruchte politiebox van Dr. Who: groter van binnen dan het lijkt.
“Elke dag worden er meerdere petabytes aan gegevens op internet gegenereerd. Slechts één gram DNA zou voldoende zijn om die gegevens op te slaan. Zo dicht is DNA als opslagmedium”, zegt Tabatabaei, die ook een vijfdejaars Ph. D. student.
Een ander belangrijk aspect van DNA is zijn natuurlijke overvloed en bijna oneindige hernieuwbaarheid, een eigenschap die niet wordt gedeeld door het meest geavanceerde gegevensopslagsysteem dat momenteel op de markt is: siliciummicrochips, die vaak slechts tientallen jaren circuleren voordat ze zonder pardon begraven worden op een hoop gestorte e -afval.
“In een tijd waarin we worden geconfronteerd met ongekende klimaatuitdagingen, kan het belang van duurzame opslagtechnologieën niet worden overschat. Er komen nieuwe, groene technologieën voor DNA-registratie op die moleculaire opslag in de toekomst nog belangrijker zullen maken”, zegt Olgica Milenkovic, de Franklin W. Woeltge Hoogleraar Electrical and Computer Engineering en een co-PI op de studie.
Met het oog op de toekomst van gegevensopslag, onderzocht het interdisciplinaire team de millennia-oude MO van DNA. Vervolgens voegden de onderzoekers hun eigen 21e-eeuwse draai toe.
In de natuur bevat elke DNA-streng vier chemicaliën – adenine, guanine, cytosine en thymine – vaak aangeduid met de initialen A, G, C en T. Ze rangschikken en herschikken zichzelf langs de dubbele helix in combinaties die wetenschappers kunnen decoderen , of volgorde, om betekenis te geven.
De onderzoekers breidden de toch al brede capaciteit van DNA voor informatieopslag uit door zeven synthetische nucleobasen toe te voegen aan de bestaande line-up van vier letters.
“Stel je het Engelse alfabet voor. Als je maar vier letters had om te gebruiken, zou je maar zoveel woorden kunnen maken. Als je het volledige alfabet had, zou je onbeperkte woordcombinaties kunnen maken. Dat is hetzelfde met DNA. In plaats van nullen en enen om te zetten in A, G, C en T, we kunnen nullen en enen converteren naar A, G, C, T en de zeven nieuwe letters in het opslagalfabet,” zei Tabatabaei.
Omdat dit team de eerste is die chemisch gemodificeerde nucleotiden gebruikt voor informatieopslag in DNA, innoveerden leden rond een unieke uitdaging: niet alle huidige technologie is in staat om chemisch gemodificeerde DNA-strengen te interpreteren. Om dit probleem op te lossen, hebben ze machine learning en kunstmatige intelligentie gecombineerd om een unieke verwerkingsmethode voor het uitlezen van DNA-sequenties te ontwikkelen.
Hun oplossing kan gemodificeerde chemicaliën onderscheiden van natuurlijke en elk van de zeven nieuwe moleculen van elkaar onderscheiden.
“We hebben 77 verschillende combinaties van de 11 nucleotiden geprobeerd en onze methode was in staat om ze allemaal perfect te differentiëren,” zei Pan. “Het deep learning-framework als onderdeel van onze methode om verschillende nucleotiden te identificeren is universeel, wat de generaliseerbaarheid van onze benadering naar vele andere toepassingen mogelijk maakt.”
Deze letter-perfecte vertaling komt met dank aan nanoporiën: eiwitten met een opening in het midden waar een DNA-streng gemakkelijk doorheen kan. Opmerkelijk genoeg ontdekte het team dat nanoporiën elke afzonderlijke monomeereenheid langs de DNA-streng kunnen detecteren en onderscheiden, of de eenheden nu een natuurlijke of chemische oorsprong hebben.
“Dit werk biedt een opwindende proof-of-principle demonstratie van de uitbreiding van macromoleculaire gegevensopslag naar niet-natuurlijke chemie, die het potentieel heeft om de opslagdichtheid in niet-traditionele opslagmedia drastisch te verhogen”, zegt Charles Schroeder, de James Economy Professor of Materials. Science and Engineering en een co-PI over deze studie.
DNA heeft letterlijk geschiedenis geschreven door genetische informatie op te slaan. Zoals uit dit onderzoek blijkt, is de toekomst van gegevensopslag net zo dubbel spiraalvormig.
S. Kasra Tabatabaei et al, Uitbreiding van het moleculaire alfabet van op DNA gebaseerde data-opslagsystemen met Neural Network Nanopore Readout Processing, Nano-letters (2022). DOI: 10.1021/acs.nanolet.1c04203
Nano-letters
Geleverd door Beckman Institute for Advanced Science and Technology