Feeds:
Indlæg
Kommentarer

Archive for juni 2012

Et interessant emne på IFLA International Newspaper Konference 2012 var crowdsourcing.

Basalt set betyder crowdsourcing, at man får en gruppe personer til at hjælpe sig med at løse en opgave. Personerne løser opgaven på frivillig basis – oftest uden betaling – og løsningen tilhører efterfølgende opdragsgiveren.

Når det drejer sig om digitaliserede aviser, er crowdsourcing begyndt at vise sig som et nyttigt redskab til at optimere brugeroplevelsen, når man bevæger sig rundt i aviserne. Et godt eksempel på, hvordan man som bruger kan udøve crowdsourcing, er Digitalkoot. Digitalkoot er et samarbejde mellem det finske nationalbibliotek og firmaet Microtask, hvor målet er at rette fejl i bibliotekets samling af digitaliserede aviser. Når fejlene bliver rettet, forbedrer det resultatet af søgning i aviserne. Dags dato har mere end 104.000 mennesker besøgt hjemmesiden, og lagt 378.219 minutters arbejde i opgaven. Det svarer til, at der er blevet rettet 7.097.412 fejl i arkivet. Ganske godt klaret af en gruppe frivillige.

Et andet godt eksempel findes i Australien, hvor det australske nationalbibliotek bl.a. stiller en række digitaliserede aviser til rådighed online i deres portal The Trove. De lægger op til, at man som bruger kan hjælpe med at forbedre brugeroplevelsen ved bl.a. at rette i OCR-teksten, hvis der er tydelige fejl i den. Det er nemt at bidrage til opgaven. Laver man en søgning og støder på fejl i den elektroniske udgave af teksten, bliver man i visningen af det enkelte hit præsenteret for muligheden for at korrigere fejlene. Interessant er det at se, at der på en tilfældig dag er lavet mere end 111.000 korrektioner i de skannede australske aviser…………

Interessant er det også at fundere over, hvorvidt en lignende mulighed for at lave korrektioner i OCR-skanningerne af vores digitale aviser ville blive modtaget med interesse, og hvor stor denne i så fald ville være.

Crowdsourcing er et udbredt fænomen, der ikke kun retter sig mod digitale avissamlinger – se f.eks. denne liste over crowdsourcing projekter, og bliv inspireret til, hvordan man nemt kan bidrage til løsningen af en given opgave.

Read Full Post »

Repræsentanter for Projekt Avisdigitalisering deltog 11.-13. april 2012 i en større konference om aviser og avisdigitalisering – IFLA International Newspaper Conference 2012. Konferencen fandt sted i Paris, Frankrig og havde undertemaet ”Newspaper Digitization and Preservation: New Prospects, Stakeholders, Practices, Users and Business Models”.

Se programmet for konferencen.

The International Federation of Library Associations and Institutions (IFLA) er en international organisation for biblioteker, som hvert år holder en stor konference forskellige steder i verden.  Næste gang er 11. -17. august 2012. IFLA er inddelt i mindre aktivitetsgrupper, hvoraf Newspapers er en af mange.

I forbindelse med dette års aviskonference bed Projekt Avisdigitalisering især mærke i de følgende små og store ting:

  • OMFANGET AF BRUGEN AF CROWDSOURCING
    Præsentationer afslørede, at en del digitaliseringsprojekter benytter sig af hjælp fra offentligheden til at forbedre deres avisprodukt. Det kan være ved hjælp af tagging, forbedring af OCR-tekst eller indberetning af fejl i det skannede materiale. Fænomenet hedder crowdsourcing.
  • HÅNDTERING AF RETTIGHEDER
    Hvert land har sine egne love og regler omkring ophavsret, og der er næsten lige så mange forskellige fortolkninger af rettighedsspørgsmålet omkring tilgængeliggørelse og formidling af de digitale aviser og lige så mange måder at håndtere lovgivningen på, som der er lande.  Lige fra indgåelse af aftaler med aviser, etablering af fonde i tilfælde af rettighedstvister, liberal fortolkning af skæringsårstallet (frie aviser vs. copyrightbelagte) mm.
  • SAMME OPGAVE – MANGE VARIATIONER
    Målet er det samme for alle digitaliseringsprojekterne – at skabe digitale avissider – men der er forbløffende mange måder at gøre det på. Forudsætningerne i form af kvaliteten af originalmateriale, økonomi, ophavsretlige begrænsninger, tid, målgrupper og brugernes interesse og behov er uhyre forskellige. Samtidig er der også store forskelle mht. slutmålet – nogle satser på at give få aviser en meget intensiv omsorg, som f.eks. i Polen, hvor man har udviklet teknologi til effektiv deacidification (behandling mod truende syreskader). Andre aktører satser på stor volumen som i England, hvor målet er at digitalisere 40 mio. sider.

  • DAGBLADE BAG DIGITALISERING
    Et særligt fangende aspekt af konferencen bestod i oplæg fra nogle af de store udenlandske aviser, som er i gang med at digitalisere deres arkiv. Der var bl.a. oplæg fra Le Monde, Ouest-France og Corriera della Sera. De digitaliserer alle for at udnytte mulige forretningsmuligheder, men også for at bevare indholdet af aviserne. Alle ønsker de dog også at bevare deres fysiske arkiver, selv om disse er omkostningstunge. Corrierra della Sera bruger rigtig mange ressourcer på at skabe høj kvalitet i metadata, specifikt fordi de ønsker, at det historiske indhold skal indgå i deres produktionssystem for nyt indhold, således at redaktører og produktionsfolk let kan integrere artikler m.m. fra tidligere udgaver.Balancen mellem kvalitet og kvantitet er naturligvis også afgørende for aviserne. Le Monde gik først efter optimal scanningskvalitet med scanning af de trykte sider, men erkendte, at det ville blive for kostbart i længden, og de skiftede derfor til digitalisering af mikrofilm. Det gjorde de også hos International Herald Tribune, som dog supplerer med farvescanninger af avisens meget smukke modetillæg, som de også sælger til interesserede kunder.
  • BEDRE ADGANG TIL SAMLINGERNE
    Næsten alle ser digitalisering som en mulighed for at aktivere sine samlinger, at gøre det muligt for en bred målgruppe at få adgang til denne del af kulturarven. Nogle aktører digitaliserer dog primært for at bevare – deres aviser er f.eks. truet af fysisk forfald og er dermed i fare for at forsvinde for altid. For disse aviser er restaurering typisk også en del af digitaliseringsprocessen. Tilgængeliggørelse spiller dog også en stor rolle for mange: Avistitler, som er for skrøbelige til at blive brugt på læsesalen, er reelt ikke tilgængelige for publikum, hverken forskere eller alment interesserede. Med digitalisering og online tilgængeliggørelse er situationen helt forandret. Så kan alle i princippet få adgang til aviserne.
  • METADATA
    Mht. til investering af tid og ressourcer i udarbejdelse af metadata er der meget store forskelle på projekterne. Mange projekter bruger en meget stor del af bevillingen på at skabe metadata: Hvor mange sektioner, sider i hver sektion, hvor mange varianter den pågældende dag, hvor mange tillæg, indstik osv. Mange laver segmentering af avissiderne – dvs. at siden analyseres og inddeles i artikler, rubrikannoncer m.v. Nogle sætter emneord på hver artikel, nogle på udvalgte elementer som f.eks. navnestof, dødsannoncer m.m. OCR læsning bruger stort set alle. OCR gør det muligt at fritekstsøge i de mange sider – et uhyre nyttigt værktøj for stort set alle typer af brugere, jo større genkendelsesprocent, jo større værdi. For at opnå en god kvalitet er ordbøger nødvendige, hvilket er en udfordring for bl.a. gælisk i Wales og de fleste asiatiske sprog, bl.a. i Singapore.
  • PRIVAT-OFFENTLIGT SAMARBEJDE
    For avisdigitaliseringsprojekterne generelt gælder det, at de har meget store forskelle i deres økonomiske muligheder. British Library har gang i et meget ambitiøst projekt, et udsædvanligt tæt offentligt-privat samarbejde. Her er det det private firma, som finansierer og udfører digitaliseringen on-site hos British Library. Dette kan lade sig gøre, fordi der findes en meget stor engelsktalende målgruppe, som er engelske eller har engelske rødder, og som er villige til at betale for adgang. Firmaet hedder Brightsolid og driver i forvejen tjenester som findmypast.com og FriendsReunited.
  • BEVARING OG FORMIDLING
    Konferencen havde talrige eksempler på, hvordan aviser og biblioteker rundt om i verden har scannet og digitaliseret aviser og mikrofilm. Alle har de et meget vigtigt element af bevaring som en del af deres formål, men interessant nok var der i samtlige oplæg fokus på formidlingsdelen. Er formidling mere sexet end bevaring? Bevaring er naturligvis en forudsætning for formidling – nu eller på længere sigt. Langt størstedelen af bevillingen til Projekt Avisdigitalisering er givet ud fra et bevaringsperspektiv – en mindre del er øremærket tilgængeliggørelse og formidling af de digitale aviser.
  • SAMARBEJDE
    Konferencen efterlod et klart indtryk af, at der faktisk er mange, der er interesseret i avisdigitaliseringsprojekter, og at f.eks. dagblade i en del tilfælde viser interesse for at samarbejde omkring digitalisering, finansiering og formidling af de digitale aviser. Det bliver spændende at se, hvor stor interessen er blandt danske aviser, når vi i slutningen af 2012 går i gang med at kontakte aviserne for at undersøge, hvordan et samarbejde kan arrangeres.
  • PRAKTISK ERFARING
    Rent konkret viste en række oplæg om digitalisering og økonomi, at digitalisering fra mikrofilm giver det største udbytte for pengene. Skanning og efterfølgende digitalisering af papirudgaverne har været et ønskescenarie for mange af projekterne, men hvis man skal have top udnyttelse af sine midler skal man vælge digitalisering baseret på mikrofilm. Samtidig var det også tydeligt, at samarbejdet og kommunikationen med leverandøren er meget vigtigt for at opnå et optimalt flow i digitaliseringsprocessen.

Langt den vigtigste konklusion fra konferencen set i forhold til Projekt Avisdigitalisering er, at vi har vores eget sæt af forudsætninger og præmisser, og vi må selv vælge de løsninger, som passer til vores situation og præmisser. Der findes nemlig ikke en standard metode for digitalisering af aviser, som er den ”rigtige”. I stedet findes der forskellige forudsætninger og parametre, som man kan skrue på. Og det er lige præcis disse, vi er i gang med at finde og indstille bedst muligt.

Read Full Post »

%d bloggers like this: