Stafræna stökkið
Fyrir nokkrum vikum kláraði ég að skanna inn allar ljósmyndir og persónuleg skjöl sem ég hef hingað til geymt í möppum í geymslu. Ég minntist á það á Twitter og Facebook og var þá skorað á mig að blogga um ferlið. Hér er það.
Af hverju stafrænt? Link to heading
pappír, að taka pláss - mynd eftir Drab Makyo
Margt mælir á móti því að geyma gögn á stafrænum miðlum:
- Stafræn gögn eru ónothæf án rafmagns.
- Stafræn gögn þarf að vista í ákveðnum sniðum og lesa með viðeigandi hugbúnaði.
- Meiri líkur eru á að stafræn gögn sem eru ekki í reglulegri umsjón spillist á einhvern hátt (diskar bila því miður oftar en pappír).
Þó eru nokkrir stórir kostir:
- Stafræn gögn taka lítið pláss (í rúmmetrum).
- Hægt er að skipuleggja stafræn gögn á marga vegu í einu (með vistuðum leitum, eftir tímasetningum, staðsetningur o.s.frv.).
- Stafræn gögn eru aðgengileg, meðfærileg og finnanleg (undir réttum kringumstæðum).
Fyrir nokkrum árum fór ég í gegnum svipað ferli með tónlistina mína, þ.e. að færa hana af geisladiskum og vinyl plötum yfir á stafrænt snið. Það tók nokkur ár í vinnslu þar sem hug- og vélbúnaðurinn var ekki nógu hagkvæmur (öflugur/ódýr) þegar ég hóf verkið.
Við verðhrun á diskplássi hefur stafrænum ljósmyndum mínum fjölgað og þegar ég var orðinn jafn sáttur við skipulag ljósmyndana og skipulag tónlistarinnar datt mér í hug að það væru nokkrar gamlar ljósmyndir í geymslunni sem vantaði í safnið.
Þegar ég byrjaði að taka til gömlu ljósmyndirnar í geymslunni sá ég að það var haugur af alls kyns gömlum persónulegum skjölum sem gátu farið sömu leið. T.d. nótur, ýmis yfirlit, handbækur tækja og fleiri skjöl. Síðan 2004 hef ég geymt skjöl af þessu tagi stafrænt, en eldri pappírar hafa fylgt mér í gegnum nokkra búslóðaflutninga hingað til.
Ég ákvað að ef ég gæti lágmarkað ókostina, væru kostirnir þess virði að snara þessum gögnum yfir á stafrænt form.
Traust og öryggi Link to heading
Að geta treyst geymslu stafrænna gagna snýst í mínum huga um þrjú atriði:
- Að gögnin verði til staðar í fjarlægri framtíð þegar ég þarf á þeim að halda, jafnvel þótt hamfarir ríði yfir.
- Að ég eigi auðvelt með að finna gögnin í fjarlægri framtíð.
- Að gögnin séu á því sniði að ég geti lesið þau í fjarlægri framtíð.
1) Afritunartaka Link to heading
Til að geta treyst því að gögnin verði til staðar þrátt fyrir hamfarir, verður að vera til staðar skipulögð afritunartaka. Með hamfarir á ég við hvers kyns illlagfæranlegar skemmdir sem geta orðið á vélbúnaðinum (t.d. bilun eða aðrar skemmdir af völdum elds, vatns, jarðskjálfta o.s.frv.)
Skipulagið felur í sér sjálfvirka og reglulega afritunartöku innan heimilisins annars vegar (með utanáliggjandi hörðum disk og Time Machine) og utan heimilisins hins vegar með aðstoð afritunarþjónustunnar Mozy.
Uppsetningin mín er viðkvæm fyrir því að hamfarir verði annars vegar á heimili mínu og hins vegar í aðstöðu Mozy í Bandaríkjunum á sama tíma og er það veikleiki sem ég get sætt mig við. Að öðru leyti tel ég mig geta treyst því að gögnin verði til staðar í gegnum hamfarir.
2) Finnanleiki Link to heading
leit - teiknimyndin Cock & Bull
Til að auðvelt sé að finna gögnin eftir langan tíma þurfa þau að vera vel merkt og flokkuð á þann veg sem virkar fyrir mig.
Eftir að hafa notað Gmail póstþjónustuna þar sem nóg er af plássi og leitin góð er freistandi að hugsa þetta á sama hátt. Maður hendir þá öllum skjölunum í eina hrúgu, flokkar lítið og finnur það sem leitað er að með textaleit (eins og er til staðar í Windows og OS X). Ég velti því einnig fyrir mér að styðjast mikið við lykilorð (e. tags sem eru algeng á svokölluðum “web 2.0” vefjum) því að þá þarf ekki að leggja vinnu í að skipuleggja flokkatré, heldur skella nokkrum “töggum” á skjalið og málið dautt (fyrir áhugasama þá er Punakea forrit til að ’tagga’ skjöl sem vinnur vel með OS X).
Vandamálið er að þegar nokkrir mánuðir eða ár eru liðin frá því að maður kemur skjali fyrir á einhvern stað, þá getur verið auðveldara að muna leiðina að skjalinu heldur en að muna hvaða orð komu fyrir í skjalinu. Einnig virkar heilinn á mér þannig að ég nota mismunandi orð yfir sömu hlutina eftir því hvaða samhengi á við. Því get ég ekki treyst því að orðin sem ég nota í dag til að merkja skjölin séu þau sömu mér dettur í hug að slá inn í leitarglugga nokkrum árum síðar.
Á endanum ákvað ég að búa til nokkra flokkatré til að ná utan um allt sem ég myndi vilja geyma. Ég ætla ekki að telja flokkana mína upp hér en dæmi um flokka í rót trésins gætu verið: heilsa, fjármál, fjölskylda, vinna o.s.frv. Markmiðið með flokkunum mínum var að allt myndi eiga sinn stað og að það væru sem fæst grá svæði. Með gráum svæðum á ég við þegar óvíst er hvaða flokk ákveðið skjal tilheyrir.
Það er engin ein töfralausn í boði. Flokkunartré, lykilorð (e. tags) og lýsigögn (sbr. author, company o.s.frv í Word eða artist, title o.s.frv. í iTunes) ásamt textaleit og leitarsíur (smart / virtual folders) eru allt góð tól til að auka finnanleika*. Í mínu tilfelli er skýrt flokkatré gott öryggisnet þegar annað klikkar.
*Aukin finnanleiki er tvíeggjað sverð. Gömul persónuleg gögn eru allt í einu orðin finnanleg á 20 sekúndum í staðinn fyrir að vera í ómerktum kassa undir öðrum kassa í geymslunni. Takmarka þarf aðgang ef maður vill vernda einkalífið fyrir gestum og gangandi, en ágætis tól eru til þess í nútíma stýrikerfum og fer ég ekki nánar út í það hér.
3) Snið Link to heading
Fyrir tæpum 20 árum bjó ég til tónlist á Atari ST tölvu í tónlistarforritinu Protracker og geymdi skrárnar (svokallaðar MOD skrár) á 3 1/2 tommu “floppy” diskling. Þegar ég rakst aftur á disklingana, fyrir nokkrum árum, gat ég sem betur fer fundið forrit sem gat lesið Atari sniðið og bjargað gögnunum. Næst þurfti ég að finna tónlistarforrit sem gat spilað MOD skrárnar og komst þá að því að Winamp (mp3 spilarinn) studdi að spila MOD skrár og gat vistað tónlistina í wav og mp3 sniði sem þýðir að ég get hlustað á lögin hvenær sem er án fyrirhafnar. Tónlistin er ekki upp á marga fiska, en þetta er ágætt dæmi um að það þarf að gæta að skráarsniðum og sniði diska sem geyma skrárnar.
Internetið veitir manni ákveðna öryggiskennd og leyfi ég mér að reikna með því að ég geti opnað jpg, png, doc, xls, pdf, zip, mp3, wav sniðin um ókomna tíð. Ég reyni að vista ekkert í “nýjum” og lokuðum sniðum sem hafa ekki “sannað sig” og eru ekki opnanleg í nokkrum forritum á Windows/OS X/Linux stýrikerfunum.
Note to self, endurskoða 1, 2 og 3 ef internetið hrynur.
Popular Mechanics síðan 1997 - mynd eftir Stephen Pierzchala
Umfang Link to heading
Þegar ég var búinn að safna öllu saman sem hægt var að lesa yfir á stafrænt form fannst mér svolítið yfirþyrmandi hvað ég hafði verið duglegur að safna dóti. Þarna voru til dæmis launaseðlar síðan 1987 og enn eldri dagbókarskrif, skrifuð á því skeiði ævi minnar þar sem mér fannst ásættanlegt að skrifa með vaxlitum. Ég fór að velta því fyrir mér hvort ég gæti ekki sleppt einhverju og þannig auðveldað mér lestur gagnana yfir á stafrænt form (í flestum tilfellum skönnun). Ég áttaði mig þó fljótlega á því að það eru nokkrir ókostir við það ferli:
Þar sem margt á eftir að vekja upp minningar getur verið snúið að ákveða hverju skal henda og hverju haldið. Það er líka erfitt að láta sér detta í hug hverju maður á eftir að fá áhuga á eftir nokkur ár. Að öllu jöfnu fer tími í að fara í gegnum dótið og þá er spurning hvort maður sé mikið verr staddur með að taka allt saman (gagnamagn skiptir ekki miklu máli þar sem hvert skjal tekur oftast 1-4 MB).
Á endanum ákvað ég að hætta að hugsa og byrja að skanna.
Lestur, merking og flokkun Link to heading
hvar á að byrja? - mynd eftir Orin Zebest
Upplausn Link to heading
Ég veit um dæmi þess fyrir nokkrum árum að sömu vinyl plöturnar hafi verið teknar upp nokkrum sinnum yfir á stafrænt form. Ástæðan fyrir því var að upplausnin sem var notuð í hvert skipti var “nógu góð” (eins og í “þetta hlýtur að vera nógu gott”), en svo kom annað í ljós síðar. Mig minnir að fyrsta upptakan hafi verið í 96 kbps og endanleg upptaka hafi verið 256 kbps eða 320 kbps.
Ég ákvað því að skanna með tvöfaldri upplausn sem mælt var með fyrir viðkomandi skjal. Það kemur í ljós síðar hvort ég muni sjá eftir því en eins og er get ég ekki ímyndað mér annað en að 600 pixlar á tommu sé nóg fyrir ljósmynd.
Ferlið Link to heading
Hér er ferlið sem mér fannst hentugast:
- Skanna allt inn án þess að merkja eða flokka.
- Fara í gegnum allt og grófflokka (t.d. ár og/eða tegund skjals), snúa (e. rotate) og sníða (e. crop).
- Fara í gegnum hvern bunka og merkja hvert skjal með tímasetningu og nafni.
Dæmi: “19891010 master sound” (nóta fyrir kaupum á hljóðkorti fyrir Atari tölvuna sem ég minntist á hér að ofan) - Fínflokka öll skjölin í flokkatréið sem ég nefndi hér að ofan.
Með því að taka fyrir eitt verk í einu fyrir öll skjölin gat ég náð sæmilegum hraða þar sem ég er ekki alltaf að skipta um “context” (líkt og í færibandavinnu). Í allri færibandavinnu skiptir hraði og gæði tólanna miklu máli þar sem 5 sekúndur til viðbótar við hvert handtak getur kostað mikinn tíma þegar handtakið er endurtekið oft.
Ég skannaði flest, en stundum var hentugra að taka ljósmyndir (t.d. af plakötum). Ég notaði tvær tegundir af skönnum, en seinni skanninn var mun fljótari með hverja skönnun og hugbúnaðurinn gerði meira fyrir mig í hverri skönnun. Ég var því mun fljótari að klára verkið en leit út fyrir í byrjun þegar fyrri skanninn var á fullu.
Hugbúnaður Link to heading
leitað að texta í mynd í Evernote - mynd eftir Ben Smith
OCR (Optical Character Recognition) er tækni sem gerir hugbúnaði kleift að greina textainnihald úr myndum af texta. Ég reikna með að þessi tækni muni einhverntímann vera í boði fyrir leitarvélar stýrikerfana Windows og OS X og mun ég þá geta leitað að orðum í ljósmynduðum eða skönnuðum texta. Einstaka forrit (t.d. Evernote) bjóða upp á þennan möguleika, en eins og er finnst mér þetta ekki svo aðkallandi að ég vilji flytja skjölin mín í sérstakt forrit og flokka allt upp á nýtt til þess.
Eins og er þá finnst mér traustast að nota möppurnar á harða disknum til að flokka skjölin. Á sínum tíma fannst mér það líka með tónlist, en er núna farinn að treysta iTunes fyrir þeim. Það er sérhæft fyrir tónlist og býður upp á flokkunarmöguleika án þess að fela tónlistina í sínum eigin gagnagrunni. Einnig eru upplýsingarnar sem ég set á lag (titil, höfundur o.s.frv.) skrifaðar í skránna sjálfa (með ID3 sniðinu) og er ég því eingöngu háður iTunes vegna fídusana, en ekki upp á heilleika tónlistarsafnsins. Með öðrum orðum, þótt ég myndi skipta úr iTunes yfir í Winamp, þá myndi tónlistarsafnið halda þeim upplýsingum um nöfn hljómsveita, nöfn laga og fleira sem ég hef skráð með iTunes, þótt ég myndi skipta yfir í t.d. Winamp.
Eins og er þá hef ég ekki fundið sambærilegt forrit fyrir restina af skjölunum (fyrir utan ljósmyndirnar) en ég geri þá kröfu á forritið að ég verði ekki upp á það kominn:
- Að það loki ekki skjölin inni í sínu eigin sniði, heldur vinni með skjölin eins og þau eru á harða disknum.
- Að skráning sem ég geri í forritinu sé ekki háð forritinu, heldur vistist hún með einhverjum hætti í skjalið sjálft.
Evan Sharp skrifar hér ágætis grein um hlutverk skráarumsýslu tóla (eins og Finder í OS X) annars vegar og sérhæfðra skjalaumsýslu tóla (eins og iTunes) og hugsanlegan samruna þeirra.
Minni og minningar Link to heading
Stundum finnst mér minnið mitt vera lélegt. Að minnsta kosti eru minningar mínar eru ekki heilsteypt saga af mér frá því að ég man eftir mér, heldur mörg lítil púsl sem kunna að tengjast hvoru öðru yfir mörg ár. Ljósmyndir, tónlist, póstkort og jafnvel kvittanir hjálpa við að viðhalda þessum tengingum og styrkja.
Ég fann t.d. filmu með myndum sem ég tók á hjólreiðatúr á þá nýlegu hjóli en átti erfitt með að tímasetja þær. Síðar fann ég kvittun fyrir nokkrum aukahlutum fyrir hjólið. Tímasetningin á þeim var mars 1991 og var ég því kominn með betri hugmynd um tímasetningu myndanna.
Nýlega hafa minniskortaframleiðendur kynnt nýju SD kortin sín sem eru 64 GB. Það er því ekki langt í að ég muni geta sett allt sem ég hef talað um hér að ofan á eitt slíkt sem er 32 mm á hæð, 24 mm á breidd og 2,1 mm á þykkt.
Að lokum Link to heading
Þetta var athyglisvert ferli. Ég græddi smá pláss í geymslunni, en dótið sem er ekki hægt að skanna eða taka mynd af tekur ennþá mesta plássið. Þrívíddarskönnun og viðmót gera það ef til vill mögulegt í framtíðinni, en sumir hlutir hafa of mikið tilfinningalegt gildi.
tilfinningalegt gildi - mynd eftir Brian Jeffery Beggerly
Það eru til aðrar leiðir til að skipuleggja físíska hluti stafrænt án þess að flytja þá yfir á stafrænt form. Stundum er nóg að skrá niður hlutina til að geta flett þeim upp auðveldlega og haft góða yfirsýn. Delicious Library forrit til að skrásetja bækur, myndir, tölvuleiki, leikföng og fleira. Ég hef notað það í svolítinn tíma og get mælt með því.
skjámynd úr Delicious Library - mynd eftir Joel Rossol
Ég vil þakka Betu og fjölskyldunni fyrir að hjálpa mér við þetta verkefni.
hamfarir -
leynir á sér -