Infomäe kaevurid
Kristjan Port
01.04.2005

Infoallikaid ühendava World Wide Webi vahendusel on inimestel esimest korda ajaloos tekkinud piirituna näiv juurdepääs teiste mõtetele ja loomingule. Nii palju vabadust ühe korraga mõjub lausa joovastavalt. Ning mida rohkem harjume, seda rohkem hakkame infojoobest sõltuma. Uuringud näitavad, et umbes 60% täiskasvanud kasutajatest peavad internetti igapäevase elu lahutamatuks osaks. Kas suudame uue infokülluse olukorraga hakkama saada?

Tehniliselt võttes toidavad sõltuvust info tekitajad. Aastas tõstetakse inimkonna õlgadele juurde umbes 5 miljonit terabaiti ehk viis heksabaiti uut informatsiooni (vt lisaks samas loos "Väikesed suured baidid"). Värske elektrooniline info levib neljal füüsilisel kandjal – trükimeedia, filmi ning magnet- ja optiliste kandjate kaudu. Vormiliselt saame elektroonilise infodoosi kätte nelja kanali vahendusel – telefoni, raadio, televisiooni ja interneti kaudu. Seejuures viimane ületab enamikul juhtudel teisi nii kiiruse kui ulatuse poolest. Uuest infost rohkem kui 90% on talletatud erinevatel magnetkandjatel ja peamiselt internetilembeste arvutite kõvaketastel. Seega pole ime, miks ning kuidas info üha rohkem internetti kandub.

Inforuum kasvab ülikiiresti ja kaootiliselt. Üllatuseks on kujunenud paradoksaalne olukord, kus vastuseid võimalikele küsimustele kuhjub iga hetkega üha rohkem, kuid reaalselt peidab keegi vajalikud vastused kusagile ära, pakkudes asemele tuhandeid vildakaid viiteid. Järelikult on olemas vajadus ja suur klientuur (maailmas on orienteeruvalt 600 miljonit inimest, kes kasutavad internetti), aga samas ka võimalus raha teenimiseks neile, kes aitavad võimalikult kiiresti vajaliku infoni jõuda. Analüütikud lubavad lähimate aastakümnendite jooksul infootsingute turule väljajagamiseks kuni pool triljonit dollarit.

Loomulikult on olemas ka üritajad! Kuid tänast olukorda iseloomustab kõige paremini võrdlus lapsepõlvega. Otsingumootorite kallal toimetajate keskmine vanus läheneb alles viiele aastale. Üritajate võimed jäävad kordades alla ülesande suurusele. Domineerivaks meeleoluks on ideedega mängimine. Avalikkus ei taju, et tegemist on olulise valdkonnaga. Ning enamik käib ühest liivakastist teise ega sõlmi kellegagi püsisuhteid. Samas on just tänane periood vaatemänguliselt huvitav. Pealegi annab otsingumootorite eluolu mõistmine igapäevaselt praktilist kasu, sest info täpsem ja kiirem haldamine on selge konkurentsieelis.

Infomäe suurus
Raske on selgitada otsijate tegevust kirjeldamata objekti, mille kallal nad askeldavad, s.o interneti inforuumi. Paljud kindlasti pettuvad, kuuldes, et neile interneti otsingute pähe pakutavad teenused kokku katavad vaid tühised 1-2% internetis olemasolevast informatsioonist. Üksikud firmad ei suuda oma vägevast arvutipargist hoolimata lihtsalt püsida meediatööstuse ja uute digitaalsete tasku-, süle- ja lauaseadmete infotootmise tempos. Seega on vaja tänase napi protsendiosa kahanemise vältimiseks ilmtingimata infomahu kasvust ette jõuda.

Siiski võiks optimiste hoida tuju langetamast täpsustus, et mitte kõik kuhjuv info pole uus (täiesti uut on umbes 30%), vaid enamikel juhtudel kopeerib juba olemasolevat. Järelikult võib rahulikult kaevandada vanas, kuna see ei kao kusagile. Tõeliselt seisma jäänud infos kaevandamise näiteks on Google'i hiljutine kokkulepe muuta nn kvaliteedimäe tippu kuuluvate Harvardi, Stanfordi, Oxfordi ja Michigani ülikoolide ning New Yorgi avaliku raamatukogu raamatufondide miljonid raamatud skaneerimise teel otsingumootorile elektrooniliselt loetavaks.

Kõige värskema info paremaks nägemiseks on mõistlik kontrolli alla saada kanalid, kust seda juurde tuleb. Järelikult pole ka ime, miks Microsoft, Yahoo, Google jt on huvitatud selliste olulisemate info tekkekohtade omamisest nagu veebiportaalid, e-postiteenus, blogide serverid (avalikke päevikuid tähistav lühend sõnast Weblog) ning muusika ja piltide vahendamise keskkonnad jne. Raamatutesse ümberarvestatult täitub ühe interneti juurdepääsu omava inimese kohta uuest infost ühe aastaga 100meetrine raamaturiiul! Taoline lugemiskohustus paneks nutma ilmselt ka andunud bibliofiili. Kuigi raamatumetafoor pole siin kõige sobivam, sest keegi ei kuula muusikat ega vaata pilte, lugedes silmadega digitaalset infot, on selge, et uut infot tekib tänaste otsingufirmade jaoks liiga palju.

Tulevikku silmas pidades peab hoiatama, et kõvaketta magnetismile ootab kinnijäämist veel umbes kolm-neli korda rohkem uhiuut infot. Need on tele- ja raadiosaated ning loomulikult telefonikõnedes edastatu. Siin on juba arvesse võetud, et maailma raadio- ja teleprogrammidest moodustab täiesti uus materjal umbes veerandi ning ka telefonis on teatud osa korduval. Pikkade kõnede pidajad teadku, et telefonides kõneldu maht ületab kogu maailma televisioonis ja raadios edastatu üheksa korda.

Kuid seda infot ei tea mitte ainult antud loo lugejad. Pole raske arvata, miks näiteks Google ja Blinkx alustasid aasta alguses uue teenusega, TV eetri otsimisega. Küsijale näidatakse vastuseks saatelõiku, milles otsingusse sisestatud sõna kasutati (kõrvalpõikena võib oletada, kui palju taoline teenus edendab demokraatiat ja sunnib poliitikuid avalikke väljaütlemisi täpselt kaaluma). Pealegi levivad kuuldused, et Google huvitub internetitelefoni teenusest. Kui juba praegu stenografeeritakse TV-saadete tekste, siis võib vaid ette kujutada, kuidas tulevikus otsivad tähtsad tädid ja onud oma kõnede stenogrammidest, millal, kellele, mida ja kuidas nad ütlesid.

Peidetud varandused
Lisaks tehniliste võimaluste mahajäämisele võidujooksus infohulga kasvuga, on veel üks põhimõtteline põhjus, mis jätab meid kasvava infomäe külge kratsima. Otsijad lihtsalt ei pääse kaugemale ehk sügavamale, kuna see hinnanguliselt 500 korda suurem osa on teisel pool mõttelist sisselogimise ekraani. Nn pinnakihiinfost oluliselt suurem osa lebab peidus andmebaaside abstraktsetes kirjetes, mis muutuvad loetavaks alles päringuid tehes. Lisaks vajab märkimisväärne osa kõigile vabalt kasutatavast materjalist mingisugust registreerimist. Ja suur osa informatsiooni avab ennast vaid raha eest. Ning lõpuks on asju, mida varamu omanike arvates kõik ei peagi teadma. Nendest takistustest täna veel mööda ei pääse.

Internetis tõeline "kaevamine" on alles algamas. Teekond võiduka lõpuni on kallis ning täis ohte, sest ees ootab palju juba teada olevaid probleeme ja lisaks hulganisti teadmatut. Pealegi on samal rajal teisigi seiklejaid. Arvata võib, et edu saadab suuremaid "karavane" – neid, kes suudavad finantsriske kellegagi jagada. Näiteks börsi vahendusel. Kaks hetke suurimat – Google ja Yahoo koguvad enda taha üha rohkem kasutajate usku, kui vaadata nende aktsiate hinna pidevat tõusu. Aastavahetusel lisandus rühkijate teele ootuste kohaselt Microsoft. Need, kes pole suured ega suuda börsilt raha saada, peaksid seega olema ära sõnutud ebaõnnestumisele. Täna see nii siiski veel ei ole, sest lisaks rahale on vaja ka taibukust. Kuna viimast leidub massides rahast vähem, on headel ideedel täna veel teatud eeliseid. Seega pole sugugi lootusetu näha uute ideede najal tärkavaid firmasid, kes hiljem suure tõenäosusega liituvad kalli raha eest mõne suurega.

Väikesed suured baidid
Kõnes on kilod kerged, kuid kotis rasked. Info näiliselt lõputu kergus omab veel ühte mõõdet – väärtust. Kuna väärtuse määrab peamiselt kasutaja vajadus, siis allpool on kirjeldatud erinevaid info mahu suurusjärke, kuhu iga lugeja võib paigutada vastavalt oma äranägemisele enda tarvitatava koguse infot. Üldine reegel paneb paika, et hangitava info väärtus ei tohiks olla väiksem selle hankimiseks tehtavatest kuludest. Seetõttu peaksime oma aja, tähelepanu ja raha raiskamise vältimiseks hoiduma mittevajaliku infoga tegelemisest, veel enam kogumisest. (Esitatud suurusjärgud erinevad omavahel tuhandekordselt, alates kilobaidist).

1 bait – üks tähemärk;
10 baiti – enam-vähem üks sõna;
1 kilobait – anekdoodi pikkus;
2 kilobaiti – üks täistrükitud A4-leht;
1 megabait – 500 lk romaan;
5 megabaiti – kõik Shakespeare'i teosed kokku;
100 megabaiti – umbes meeter raamatuid raamatukogu riiulis;
1 gigabait – veoautokastitäis raamatuid;
1 terabait – 50 000 puu jagu raamatuid (üks puu annab paberina 80 500 lk);
136 terabaiti – kõik 17 miljonit raamatut maailma suurimas USA Kongressi raamatukogus;
200 petabaiti – kogu trükitud materjal planeedil Maa;
5 heksabaiti – kõik inimkonna ajaloo jooksul lausutud sõnad.

Järgmises numbris tulebki juttu ideedest, kuidas keegi üüratust ülesandest üritab jagu saada.

Sarnased artiklid