Kas info on igavene?

Tiit Kaljuste
31.01.2022

Kas oskate ette kujutada, et 100 aasta pärast on digiarheoloog väärikas ja nõutud amet. 22. sajandi uurija vaatab hardunult kujutisi, mis on taastatud kunagistelt infokandjatelt. Teine uurija sorteerib keerukate tehisintellekti algoritmide abil välja vajalikku infot, mis on peitunud hiiglaslikesse andmemassiividesse. Kuid kahjuks pole kõik säilinud. Kui kiiresti info kaob ja kui kaua säilib?

Andmemahu kasv maailmas on hiiglaslik, ennustuste kohaselt aastatel 2020-2025 üle 19% aastas. Tulevik on lausa nõnda tume, et varsti võibki kuluda kogu ressurss info salvestamisele, jagamisele ja töötlemisele. See kõik viitab olukorrale, kus on viimane aeg kriitiliselt üle vaadata, mida säilitada ja mis tuleb kahjuks ajaloo prügikasti saata. Suurte andmehulkade sorteerimisel on abiks tehisintelligents, mis loodetavasti suudab väärtuslikuma välja noppida.

Teisalt info vananeb. Twitterisäuts vananeb minutite ja tundidega, niisamuti spontaansed vestlused internetis. Eilne uudis on juba vana uudis. See tähendab, et palju infot vananeb kiiresti, kuid on ikkagi kuhugi salvestatud. Kuid kui kaua? On näiteks teada fakt, et aasta tagasi üles laetud andmemahust on täna kasutusel vaid 2%. Ülejäänud 98% tuleks kriitiliselt läbi sorteerida ja enamalt jaolt kustutada. Osalt tegelevad sellega internetihiiud, osalt lõppkasutajad. Digitaalne personaalne info pole sugugi vähemtähtis kui sajandivanused fotod esivanematest. Lihtsalt kõike on nüüd palju rohkem, kuid mitte füüsiliselt, vaid digitaalselt.

Internetisaitidele salvestatud info muutub pidevalt, kõige kiiremini uudisteportaalides. On vähe lehekülgi, mis püsivad muutumatuna aastaid. Internetisaidi eluea maksimaalseks pikkuseks võiks olla ligikaudu 20 aastat, tavaliselt piirdub see mõne aastaga. Seega on palju aastate jooksul salvestatud ja avalikkusele kättesaadavat infot jäädavalt kadumas.

Peamise osa internetiliiklusest moodustavad videod. Kui 2014. aastal moodustasid videod 67%, siis 2019. aastaks oli see juba tõusnud 80%-ni. 2019. aastal liikus juba rohkem kui pool maailma andmesidest läbi nutiseadmete. Sama trend jätkub tõenäoliselt aastaid.

Lähiperspektiivis saab vähendada andmemahtu suurema pakkimistihedusega, kuid siingi tulevad piirid kiiresti ette. Järgmine samm on mittevajalike, vähekasutatavate ja vananenud andmete kustutamine. Internetihiid YouTube ägab üleslaetavate videofailide hulga all. Kui video vaatamiste arv langeb allapoole seatud kriteeriumi, siis see kustutatakse. Failide mahtu vähendatakse suurema pakkimistiheduse ja pildikvaliteedi hinnaga. See on nagu lõputu võitlus mitmepealise lohega.

Järgmiseks tuleb päevakorrale küsimus, milline andmekandja on loetav 50, 100 või 200 aasta pärast? Kas meil on võimalik aastakümnete pärast ilma probleemideta lugeda mälupulgale või CD-le talletatud faile? Vastus on, et tõenäoliselt ei ole. Tehnika areng on olnud nii kiire, et tänased tehnilised lahendused on aastakümnete pärast lootusetult vananenud.

Vana tehnika lakkab aja jooksul töötamast ja see on paratamatus. Kui 1960-1970. aastate raadioaparatuuri saab veel lihtsalt putitada, siis arvutitehnikat põlve otsas ei paranda. Tuleb välja vahetada mitte üksikdetail, vaid terve plokk. Ja seda pole enam saada või on viimasedki lakanud töötamast. Uuemad seadmed toodetakse tihti tervikliku plokina. Seade töötab niikaua kuni temaga midagi juhtub ja siis tuleb ta välja vahetada. Kogu lugu. Ei mingit parandamist.

Kellel on kodus kolm aastakümmet vana arvuti? Kui see isegi tolmub kusagil panipaigas, siis selle töökorda saamine on probleem ja kõvakettalt failide kättesaamine veel suurem peavalu. Puudub näiteks USB väljund, kuid on disketidraiv, mis enam ei tööta. Failiformaadid on lootusetult vananenud, fotod on imepisikesed. Veel paarkümmend aastat ja sellist arvutit on pea lootusetu käima saada. Aga kes üldse mäletab, kuidas nii vana masina taga asju ajada. Vanaisa mäletas, aga suri ära... Salasõnasid ka alles ei jätnud.

Erinevad infokandjad

Vanimad infokandjad on kivisse raiutud tekstid ja pildid. Infot on vähe ja sellest arusaamine keeruline. Aga õnneks säilib hästi. Esimesed fotod ilmuvad 19. sajandi esimesel poolel ja neil kujutatu peegeldab esmakordselt reaalsust. Kõik varasem on kunstniku käe alt läbi käinud ja moonutab tegelikkust.

Heli ja liikuva pildi jäädvustamine sai alguse 19. sajandi lõpus. Vanimaks säilinud papüürustekstiks on Mereri päevik püramiidide ehitamise ajast, vanimad säilinud raamatud on pisut üle 1000 aasta vanad.

Digitaalne video ilmus tavakasutusse 1995. aastal, digitaalfotograafia algusajaks loetakse kokkuleppeliselt aastat 2000. Digitaalselt saime tekste salvestada juba 1980tel aastatel.

Lihtsustatult võib salvestatud info jagada teksti-, foto-, heli- ja videofailideks. Kõige rohkem andmemahtu võtavad videod, seejärel fotod ja helifailid. Tekstifailid seevastu on üsna mahusõbralikud, ühele mälupulgale võib salvestada lausa raamatukogutäie tekste.

Järgnevalt vaatleme mõningaid laiemalt käibinud andmekandjaid.

Arvutidiskett

1980tel aastatel oli enamlevinud kaasaskantavaks infokandja formaadiks 5,25'' ümbrikketas. Eestis olid need vähelevinud lauarvutite vähese leviku tõttu. Kui neid juhtubki mõni kodus olema, pole neilt võimalik midagi lugeda, sest uute arvutitega ühilduvad välised seadmed puuduvad.

Kolmkümmend aastat tagasi asendusid pehmed ümbrikkettad 3,5'' diskettidega. Eestis kasutati neid kuni 2000. aastate alguseni. Nendelt info kättesaamine pole väga keeruline, nende lugemiseks tuleks osta väline USB-disketilugeja. Netipoodides on hulgaliselt erinevaid Hiina päritolu disketilugejaid, kuid soovitaks siiski mõnda vähekasutatud ja tuntud valmistaja seadet 2000. aastate algusest.

Diskettide mahutavus on tänapäeva mõistes imeväike, vaid 1,44 MB. Ühele disketile mahub vaid üks väike tänapäevane foto, tekstifaile mahub küllaltki palju. Üks lehekülg vormindamata teksti vastab ligikaudu 2,5 kilobaidile.

Loo autor alustas vanade vanade failide kopeerimist kõige väärtuslikumatest dokumentidest. Juba paarikümne disketi kopeerimisel ilmus oodatud seaduspära. Disketid, mida oli kasutatud failide arhiveerimiseks vaid üks kord, töötasid laitmatult ja info sai 100% arvutisse ümber kopeeritud. Seevastu kõikide teiste diskettide puhul, mida igapäevaselt kirjutamiseks ja lugemiseks kasutati, osutus info suures osas loetamatuks. Harva õnnestus midagi ümber kopeerida.

Optilised infokandjad

1980ndad aastad oli üleminekuperiood analoogsüsteemilt digitaalsele. Esimene optiline videoformaat LaserDisc (vt TM 10/2018), mis toodi turule 1978. aastal, oli siiski analoogsüsteemis, 1985. aastal lisati plaadile digitaalne audiorada. CD ilmus 1982. ja DVD 1996. aastal. CD kõrgaeg maailmas langes aastatesse 1999-2000, meil paar aastat hilisemasse aega.

Kirjatüki autoril on esimene LaserDisk aastast 1978 ja see mängib praegugi, kuigi esineb info kadumise märke. Ka 1980te keskpaigas toodetud CDd on siiani mängitavad. Pressitud plaatide kohta on hinnatud, et 100-200 aasta pärast mängivad neist veel pooled.

Kõik sõltub muidugi valmistajapoolsest tehnoloogiast, kasutatud materjalidest ja ka sellest, kas tehases ettenähtud tehnoloogiast ka kinni peeti. Kõige suuremaks murekohaks on osutunud liim, millega alumiiniumist augustatud infokiht põhimikule kinnitati. Esimestel aastatel kippus liim alumiiniumiga reageerima ja plaadid muutusid paari aastaga loetamatuks, eriti kehtis see LaserDisci kohta. Hiljem liimi keemilist koostist muudeti ja plaatide säilivus paranes.

Keerukam on lugu isekirjutatud plaatidega. Kõige suuremat mõju CD- ja DVD-ROM-i ajalisele kestvusele mõjutab salvestamise kiirus. Suurest hulgast kodus olevatest optilistest ketastest on osutunud probleemsemateks just kiiresti kirjutatud kettad. Esimesed tõrked tekkisid juba paar aastat pärast seismist, kakskümmend aastat hiljem on sellised kettad pea kõik loetamatud. Midagi õnnestub veel taastada, kuid mis läinud, see läinud.

Plaadi kasutuskordade arv plaadi elueale ei mõju. Pigem mõjuvad hoiu- ja kasutamistingimused. Kindlam on plaate hoida stabiilsel toatemperatuuril või jahedamas ja päikese eest varjatult. USA Kongressi raamatukogu poolt 2009. aastal tehtud uurimus näitab, et korralikult kirjutatud CD-ROM kestab 25 soojakraadi ja 50% õhuniiskuse juures kuni 200 aastat (pooled plaadid on siis loetamatud), 1000 aastaga on loetamatud 4 plaati 5-st. Määrava tähtsusega nii pika säilitamise juures on just temperatuur: kõrgematel temperatuuridel rikneb plaat kiiresti.

Väärtuslikumaid CD- ja DVD-plaate oleks mõistlik ümber kopeerida enne kui need loetamatuks muutuvad. Kindlasti on siin peavalukoht mänguritele, kelle ametlikud installikettad hakkavad loetamatuks muutuma. Neist kopeerimiskaitse tõttu niisama lihtsalt koopiat teha ei saa.

Parimaks lahenduseks optiliste infokandjate puhul oleks M-Disc, mida saab lugeda tavaliste optiliste seadmetega, kuid selle kirjutamiseks on vajalik spetsiaalne seade. M-Disci elueaks on väidetavalt 1000 aastat.

Traditsiooniline kõvaketas

Tänapäeval on kõvakettaid kahte tüüpi – HDD ja SDD. Ehk siis traditsiooniline liikuvate detailidega mäluseade ja moodsam, mehaaniliste osadeta elektrooniline komponent. HDD on aeglasem, kuid mahutab rohkem ja maksab terabaidi salvestatud info kohta vähem.

HDD-kettale ei taha tootjad tavaliselt mõnest aastast pikemat garantiid anda. Kes tahab suuri andmemahte odavalt säilitada, peaks need kopeerima arvutisisesele HDD-kettale, siis selle arvutist välja võtma ja spetsiaalsesse staatilist elektrit vältivasse ümbrisesse paigutama. Välised HDD-kettad on pisut vähem usaldusväärsed, kuid siingi tuleb pigem kiigata sobivama tootja poole. Arvutist eraldiseisval kõvakettal säilib info pikka aega, mida võib mõõta aastakümnetes. Suuremaks vaenlaseks on kokkupuutumine tugeva magnetväljaga.

Välkmäluseadmed

Kõik mälukaardid, SDD-kettad ja USB-pulgad kasutavad ühist tehnoloogiat, mis põhineb laengut salvestavatel transistoritel. Esimene välkmälukaart ilmus turule 1995. aastal ja sealtpeale on nende kasutamine plahvatuslikult tõusnud. Kõik uuemad elektroonikavidinad on sellise mäluga varustatud. Ehkki neil pole liikuvaid osi, ei tähenda see veel automaatselt, et need kestaksid igavesti.

USB-mälupulga elueaks hinnatakse vähemalt 10 aastat, tõenäoliselt kauem. Välkmälu eluea piirajaks on peamiselt kirjutuskordade arv, mitte sellelt lugemiste arv. Kui USB-mälupulka mõõdukalt kasutada, ei juhtu temaga midagi.

Hoopis teine lugu on SSD-kettaga, mis on nüüdsete arvutite keskseks seadmeks. SSD-arvutiketta eluiga peetakse üsna lühikeseks, aktiivse tarvitamise korral vaid mõne aasta pikkuseks.

Niisiis võib vaid ühe SDD-kettaga varustatud arvuti üsna kiiresti oma lõpu leida ja kogu salvestatud info on jäädavalt kadunud. Seepärast tuleks vähegi väärtuslikuma kraami alahoidmisel vältida vaid ühe SSD-seadmega arvutit. Sama lugu on nutiseadmega. Vähemalt kord-paar aasta jooksul tuleks väärtuslikud failid mujale ümber kopeerida.

USB-mälupulka tasub kasutada pigem tekstilise tekstilise info ja fotode säilitamiseks, kuna need võtavad vähem mäluruumi. Videofailide säilitamiseks pole välkmälu just sobiv lahendus.

Pilverakendused

Kõige uuemaks andmesalvestusliigiks on pilverakendused. Sinna on hea ligipääs erinevate seadmete abil ja erinevatest asukohtadest. Kuid tasuta asju pole olemas. Füüsiliselt asuvad sinu andmed kusagil kaugel andmekeskuses, mida tuleb ülal pidada. Ligi pool kuluvast energiast kulub seadmete jahutamiseks, sest andmemahu ja hinna suhet arvestades on HDD kõige soodsam valik. SDD kulutab energiat vähem, kuid on traditsioonilisest kõvakettast kallim variant veel vähemalt 10 aastat.

Lõpetuseks

Kokkuvõttes oleks targem kõige väärtuslikum digitaalne info kopeerida mitmele erinevale kandjale ja hoiustada erinevates kohtades. See oleks ka kõige lihtsam ja odavam viis personaalse info säilitamiseks.

Sarnased artiklid