• Kaldt og stabilt Polare forhold er optimale for langtidslagring. Svalbard-gruvene rommer etter hvert både internasjonalt frølager og verdensarkiv. Inngangen til Arctic World Archive befinner seg 300 meter inne i fjellet, hvor permafrosten er mest stabil. Foto: WERNER ANDERSON

Datalagring som evighetsprosjekt

Datalagring som evighetsprosjekt

Byte-tsunamien: Et lite firma i Drammen tilbyr informasjonslagring «for evigheten» på Svalbard. Selskapet opererer i et marked hvor et slikt behov øker eksponentielt. Av samme grunn jobber gigantene i digitalindustrien med flere oppsiktsvekkende konsepter.

Fra utgave: 4 / april 2021

Kaldlagring

300 meter ned i Gruve 3 utenfor Longyearbyen varierer temperaturen mellom 3 og 5 minusgrader, året rundt. Det er derfor Arctic World Archive er plassert akkurat her, i et stålhvelv dypt begravet i en nedlagt kullgruvesjakt.

Fakta

#sivilisasjonstråder

Bevaring og videreformidling av kunnskap og informasjon utgjør kritiske forbindelseslinjer i samfunnsstrukturen.

Artikkelen er del av en serie laget med støtte fra Fritt Ord, som ser nærmere på disse trådene i sivilisasjonsveven.

 

Arkivet er nabo med det langt mer kjente frølageret, og lokaliseringen er motivert av samme hensyn: I tillegg til å være beskyttet av permafrosten over, går den demilitariserte sonen rundt Svalbard mest sannsynlig klar av krigshandlinger i overskuelig fremtid.

Da Arctic World Archive tok imot sin første deponering i 2017, kom materialet fra nasjonalarkivene i Brasil og Mexico. Siden har blant annet Vatikanbiblioteket, Nasjonalmuseet, Naturhistorisk museum og Den europeiske romfartsorganisasjonen plassert sikkerhetskopier av viktige dokumenter i gruvegangene. I 2019 lagret programvareselskapet GitHub hele sin åpne kildekode på Svalbard.

Arkiveringen er offline – eller kaldlagret som det heter på fagspråket. Hvis kundene trenger å hente ut materialet, må noen fysisk gå inn og hente det.

Hva er egentlig poenget med å ha en slik backup?

 

Verdifull bakcup Vatikanbiblioteket er blant de prominente aktørene som har latt Arctic World Archive på Svalbard håndtere sikkerhetskopier av sine kulturskatter. Gruvegangen inn til arkivet er bygget slik at eventuelt fremtidig smeltevann vil drenere ut og vekk. Foto: WERNER ANDERSON

 

Upløyd mark

Dagens datadrevne verden er upløyd mark og gir helt nye utfordringer. Enorme og ekspanderende datasett ligger til grunn for stadig mer av det vi gjør og omgir oss med. I løpet av de to siste årene ble det generert mer data enn i hele menneskehetens forutgående historie.

Den totale informasjonsmengden som ble skapt, kopiert, lagret og konsumert i verden, passerte 59 zettabyte (zetta=trilliard) i 2020, og vi er inne i en eksponentiell vekst. Mens det totale volumet lå på 2 zettabyte i 2010, er prognosen for 2025 på hele 163 zettabyte, ifølge The International Data Corporation. Til sammenligning regner man med at den samlede mengden data på hele internett pr. i dag ligger på rundt 3 zettabyte.

Dermed kommer også et kritisk problem susende mot oss: Mens datamengden eksploderer, flater kapasiteten ut i de eksisterende lagringsløsningene.

 

Fysiske realiteter

De fleste av oss er blitt vant til å lagre kopier av viktige dokumenter i skybaserte tjenester. «Skyen» er dog bare et begrep for det som egentlig dreier seg om høyst jordnær lagring i geografisk spredte serveranlegg.

– Filene dine blir ikke lagret samlet på ett sted i et hierarkisk system. En sånn løsning hadde ikke gjort prosessen skalerbar for leverandørene. I stedet er filene dine spredt på vidt forskjellige lagringssteder og katalogisert etter metadata. Så når du skal hente dem frem igjen, settes dette puslespillet sammen og presenteres som hierarkisk og ordnet for deg, der du sitter på egen maskin. Mesteparten av data i verden i dag er egentlig ustrukturerte, forklarer Gard O. Sundby Thomassen. Han er underdirektør for Avdeling for IT i Forskning ved USIT (Universitetets senter for informasjonsteknologi) ved Universitetet i Oslo.

 

Gard O. Sundby Thomassen, underdirektør for Avdeling for IT i Forskning ved USIT 

 

Blant de rent praktiske utfordringene trekker han frem noe så hverdagslig som elektrisitetsforbruk. Anleggene med dataservere har et enormt strømbehov, og leverandørene av skytjenester jakter stadig på sikker tilgang på fortrinnsvis grønn energi.

De fysiske realitetene påvirker også selve datalagringen.

– Det er overraskende hvor seiglivede snurrediskene er. De blir større og større, men ikke så mye raskere. Men veldig mye av verdens data ligger på snurredisker, og bak dem igjen finner vi tapene. I dag er det fortsatt tape som er det dominerende mediet for kaldlagret data, og ifølge produsentene kan man få inn opptil 580 terabyte på en kassett, sier Thomassen – før han kommer til det avgjørende ‘men ...’:

– Når det gjelder evighetslagring, støter man alltid på problemet med bit-råte. Du vil få såkalt bit-flipping enten via tilfeldige uhell eller rett og slett som følge av bakgrunnsstøy fra universet. Derfor må man jevnlig sjekke og kontrollere innholdet på en tape. Og det blir fort kjedelig når du sitter på enorme mengder data.

Lagrede data må jevnlig kopieres over på nye bærere, og her er tidshorisonten noen få år. Store kommersielle aktører, som filmselskapet Warner Bros., har en proaktiv rutine hvor denne prosessen gjøres hvert tredje år. Automatisering kan lette oppgaven, for eksempel ved å la roboter med jevne mellomrom gjøre jobben med å kopiere informasjon over fra gamle til nye disker.

Likevel, det kan friste med en mer permanent løsning hvor det holder å kaldlagre materialet én gang.

 

Arkiveringsmarkedet

Det er her tilbud som Arctic World Archive begynner å gi mening. Store og små virksomheter – private som offentlige, eller ideelle organisasjoner – opp-dager at de sitter på viktig materiale som er ressurskrevende å vedlikeholde, men som til gjengjeld ikke trenger å hentes frem jevnlig. Og der det er et behov, oppstår det et marked.

– Det vi i utgangspunktet trodde var et tilbud for arkivsektoren, har vist seg å være av kritisk forretningsmessig interesse for virk-somheter innen alt fra forskning, skipsverft og kraftnett, til vann-forsyning og infrastruktur, sier Rune Bjerkestrand. Han er administrerende direktør i Piql, firmaet som står bak Svalbard-arkivet. Arctic World Archive er premiumtilbudet deres.

 

Totalleverandør av minnebevaring Administrerende direktør i Piql, Rune Bjerkestrand, foran avlesningsmaskinen som kundene kan bygge sine egne versjoner av. Bruksanvisningen medfølger nanofilmen, og delene er hyllevare.

 

Piql ønsket å tilby en digital datalagring på et sikkert, robust, migrasjonsfritt og varig medium, hvor materialet ikke kunne slettes, hackes eller manipuleres fra ut-siden. Løsningen ble nanofilm – en videreutvikling av det velprøvde mikrofilm*-formatet, bare med langt bedre oppløsning og kapasitet.

Fakta

* Mikrofilm

En finkornet svart-hvitt film med høy oppløsningsevne for nedfotografering av arkivmateriale.

Mikrofilmsystemet ble først brukt i 1920-årene av amerikanske banker til avfotografering av sjekker.

I 1938 begynte British Museum, på grunn av krigstrusselen, en omfattende mikrofotografering av verdifulle bøker.

 

– Fotosensitiv film er et analogt medium som er over 140 år gammelt. Det har dokumentert evnen til å bringe informasjon med seg fra fortid til fremtid, og kan også lagre digital informasjon. Den første kunden vår var høyesterett i en indisk delstat, som hadde akutt behov for å ta vare på 50 millioner historiske rettsdokumenter. I India er mikrofilm fortsatt mye brukt, noe som gjorde dem interessert i vår løsning, forteller Bjerkestrand.

For å bevitne prosessen, hvor informasjon i form av nanosølvkrystaller overføres på nanofilmrullene (kalt piqlfilm) med lyspulser fra en speilmatrise, må vi til Piqls hovedkvarter i Drammen. Her står én av kun tre maskiner i hele verden som kan utføre dette. De to andre er i Mexico og Slovakia.

– Filmen blir eksponert cirka 100 ganger pr. ramme, og så er det 20 rammer i sekundet. Lyset skrur seg altså av og på 2000 ganger i sekundet, og maskinen bruker rundt en time på å skrive en hel rull med data, forklarer Simen Fjell Olsen, production manager i Piql.

Når filmen deretter fremkalles, blir informasjonen permanent og synlig og kan spilles av optisk med en annen, langt enklere maskin. Den tekniske beskrivelsen av avspilleren følger med filmrullene. Den gjør det mulig for kunden å bygge sin egen.

Nanorullene ligger i bokser laget av polymerer som er kompatible med filmmaterialet. På den måten forhindres eventuell kjemisk lekkasje som kan påvirke filmen negativt. I tillegg pakkes boksene inn i tykk folie, som beskytter mot bakterier og ivaretar riktig luftfuktighet. Den verner også i en viss grad mot brann. Materiale som sendes til Svalbard, plasseres i containere inne i gruvegangene.

 

Produserer permanente lagringsformater Production manager i Piql, Simen Fjell Olsen, i arbeid på den ene av de tre skrivermaskinene som finnes i verden. Alle foto: WERNER ANDERSON

 

Oppdateringsfri teknologi

Bjerkestrand i Piql vil gjerne demonstrere nano-filmens store fordel, slik han ser det.

– På et magnetbånd kan du ikke umiddelbart se hva slags informasjon som ligger på det, men vårt konsept gjør dette synlig med et forstørrelsesglass.

Han tar frem en piqlfilmremse og peker:

– Her har du et bilde av Beethoven. Der er notene til «Für Elise». Og der ligger musikkfilen. Visuelle elementer og klartekst er lagret sammen med den digitale informasjonen. Filmen er dessuten utstyrt med instruksjoner for hvordan de skal avleses. Bruksanvisningen medfølger mediet. Dette får du ikke til på et magnetbånd, en minnepinne eller harddisk.

– Ideen er at dette skal kunne tas opp igjen av noen andre enn oss, selv om teknologien i mellomtiden er blitt glemt eller det har oppstått et tomrom i videreformidlingen.

Så teknologien er i prinsippet ferdig utviklet og klar for evig bruk?

– Vi har testet teknologien, med akselerert aldring, opp til 750 års levetid, men er sikre på at gruvene på Svalbard kan beskytte materialet i minst 1000 år. Vi samarbeider nå med Forsvarets forskningsinstitutt for å få verifisert at det kan vare i 2000 år der oppe.

– Det er ellers et poeng at teknologien er ferdigutviklet. Du trenger ikke tenke noe mer på det. Hvis noen finner arkivet om 100 eller 2000 år, så trenger du bare lys, forstørrelsesglass, et kamera og en computer for å lese av materialet.

 

Visuelle elementer, film, lyd og tekst Innholdet på Piqls nanofilm kan leses med en lyskilde og forstørrelsesglass, og vil i neste omgang komme med en virtuell datamaskin printet inn i selve filmremsene. Her er et bilde av månelandingen lagret.

  

Norsk Regnesentral hjelper Piql med å lage en virtuell datamaskin, som også skal ligge innbakt i nanofilmen.

– Jeg ønsker at det skal bli så enkelt at du tar et bilde med telefonen din, og så genereres en liten programsnutt. Den prosessen gjentas til alle bitene er med, og du har det maskinmiljøet du trenger for å spille av dataene, sier Bjerkestrand.

Kundene skal altså ikke være avhengig av Piqls evige eksistens for å få ut igjen materialet de har lagret. Gruvene på Svalbard eies og driftes av Store Norske Spitsbergen Kulkompani AS, som igjen er heleid av staten Norge. Det borger forhåpentlig for en temmelig varig aktør. 

Men hva med trusselen fra klimaendringene? Hva skjer med informasjonen på filmrullene dersom permafrosten forsvinner?

– Gruve 3 ligger i senteret av permafrosten, så det kommer til å ta veldig lang tid før temperaturen eventuelt når null grader. Selv om det skulle skje, er det ikke noe problem. Tommelfingerregelen for estimert levetid for film tilsier at den halveres i takt med en dobling av temperaturen. Vi har testet levetiden til 750 år i 21 plussgrader celsius. Hvis vi halverer det til 10 grader blir estimert levetid 1500 år, mens en ytter-ligere halvering til 5 grader gir hele 3000 år.

 

Supermanns krystaller

Drammenserne er selvsagt ikke alene på markedet for digital datasikring. Konkurrentene omfatter noen av databransjen største aktører, og forskningen på helt nye lagringsmetoder har allerede avfødt et par oppsiktsvekkende konsepter.

Da Microsoft i 2019 fikk anledning til å prøvekjøre sitt Project Silica på en spillefilm, som skulle lagres på og spilles av fra en brikke av nanostrukturert glass, skjedde det i samarbeid med Warner Bros. Filmvalget, 1978-versjonen av «Supermann», var ikke tilfeldig. Her benytter helten teknologi fra Krypton til å bygge seg en base på Nordpolen, hvor hele hjemplanetens kunnskapsbase er en del av pakken. All denne informasjonen er lagret på krystaller.

Project Silica, som noen ganger kalles nettopp «Superman Memory Crystal», er utviklet i samarbeid med University of Southampton. Den mer offisielle benevnelsen er 5D optisk datalagring.

Filene lages av en laser som skriver inn nanomønstre i glass-strukturen, fordelt på tre lag. Mønstrene leses av med et optisk mikroskop i kombinasjon med en polarisator, og oversettes til tekst og bilder av en KI-algoritme. Ifølge Microsoft har informasjonen på kvartsglassene overlevd både baking, koking, mikrobølger, avmagnetisering og skrubbing med stålull. Lagringstiden skal være 10 000 år.

 

I superheltens ånd Sjef for globale arkiver, Brad Collar, og teknologidirektør Vicky Colf i Warner Bros. holder opp to ulike lagringsformater for filmen «Supermann» fra 1978: 35mm-filmrullene og Project Silica-glasset. Foto: JOHN BRECHER/MICROSOFT

 

Arkivert i arvestoff

Enda mer science fiction-aktig er datalagring i syntetisk DNA. I teorien skal ett gram være i stand til å romme 455 exabyte (exa=trillion), eller mer enn nok til å lagre samtlige data fra alle de største teknologiselskapene – i minst et par tusen år. Men det må oppbevares riktig.

– Hvis du får fryst ned DNA, så har du en veldig stabil lagringsløsning, sier Gard O. Sundby Thomassen ved USIT. Han hadde en finger med i spillet da Unicef Norge i 2019 fikk Barnekonvensjonen lagret i syntetisk DNA som deretter ble deponert i Arctic World Archive.

– I tillegg har det den fordelen at det er veldig tettpakket. Vårt menneskelige genom består jo av rundt 4 milliarder basepar, hver base kan være A, T, C eller G, og DNA-lagring gir derfor en vesentlig høyere datatetthet enn et alfabet som er kun 0 eller 1 i dagens datamaskiner. Richard Feynman (amerikansk fysiker og nobelprisvinner, som er særlig kjent for sitt bidrag til utviklingen av kvanteelektrodynamikk, journ.anm.) postulerte allerede for mange år siden at «there is room at the bottom», altså at løsningene, spesielt for lagring, er å gjøre ting mindre. Utfordringen her er likevel ikke lagringen, men skrive- og leseprosessen, sier Thomassen.

– Selv i dag sliter vi med å lese av veldig lange DNA-sekvenser. Etter 3000-4000 tegn begynner det å glippe, noe som blant annet skyldes at man må begynne å lese overlappende strenger. Når man skal hente ut en lesbar, digital representasjon av informasjonen, må man ofte legge et puslespill. Prosessen krever flere kopier, siden man må finne og kvitte seg med feil som er oppstått i materialet.

– Alt dette krever stor datakraft og avanserte maskinparker. Vi snakker om utstyr i multi-millionklassen. Denne teknologien er nok langt unna å være regningssvarende.

Thomassen mener likevel at det ikke er et spørsmål om hvis, men om når DNA-lagring realiseres.

 

Plasseffektivt De rosa dråpene i reagensglasset er syntetisk DNA, fremstilt i 2016 ved University of Washingtons Molecular Information Systems Lab, med et datalagringspotensial på 10 000 gigabyte. Prosessen er langsom. I 2019 tok det 21 timer å lese ut ordet «hello» fra lagret tilstand. En av de amerikanske kapasitetene på DNA-lagring, professor Ilya Finkels-tein ved University of Texas, uttalte i fjor at han tror «det vil ta et tiår eller lenger» før teknologien kan bli moden. Foto: TARA BROWN PHOTOGRAPHY/UNIVERSITY OF WASHINGTON

 

Det ekspanderende universet.

I Drammen sier Piql-sjef Rune Bjerkestrand dette om konkurranseutsiktene:

– Vi følger med på disse tingene. Hvis vi skal være en aktør i bransjen, er det selvsagt viktig å være observant på utviklingen rundt oss. Men vi ser samtidig at vår teknologi har en unik evne til hybridlagring, både digital og analog. Jeg mener DNA-lagring er et godt stykke unna å bli en kommersiell tjeneste. Det kan bli det, og det kan bli veldig varig, men det er ikke selvberget. Kan kvartsglass være selvberget og migrasjonsfritt?

Bjerkestrand mener mange løsninger rent teknisk er imponerende, men at utfordringen er å få dem opp på et industrielt nivå, ikke minst kostnadsmessig.

– Hvis du må ha femto-lasere for å lese av innholdet og ansatte med doktorgrad i fysikk, i tillegg til et stort arkiv bare for å dokumentere teknologien som tas i bruk, så blir det veldig komplisert. Vi følger andre prinsipper, sier Pixl-sjefen.

Han tror uansett at markedet vil ha plass til flere løsninger.

– Jeg ser aldri for meg at det digitale universet skal ta slutt. Det vil alltid vokse. Så selv bare å være en nisjeaktør er veldig interessant.

 

Kilder: piql.com, news.microsoft.com, 5dmemorycrystal.com, New Scientist, Biotechnology Advances, Popular Mechanics, E & T Magazine, Ars Technica, The Verge, Medium.com