Feeds:
Indlæg
Kommentarer

Posts Tagged ‘mikrofilm’

Her følger indlæg nummer tre om kvalitetscheck af de digitaliserede avissider. Denne gang med gæsteskribenter fra Statens Avissamling, Christian Brink Christensen og Martin Lund.

STATENS AVISSAMLING

Vi har valgt Statens Avissamling i Skejby som stedet, hvor der udføres manuel kontrol af de digitaliserede aviser, også kaldet QA – quality assessment, på dansk kvalitetsvurdering. Her er Statsbibliotekets magasin med de trykte aviser fra 1668 og frem, og her er medarbejdere, der ved meget om både aviser og mikrofilm. Avisdigitaliseringen er baseret på mikrofilm, som er fremstillet igennem de seneste 50 år. Mikrofilmene er af varierende kvalitet og giver derfor også scanninger af varierende kvalitet. Kendskab til hvorfor og hvordan det kommer til udtryk, er en stor fordel, når vi kvalitetsvurderer de digitaliserede sider.

OMFANG AF MANUEL KONTROL

Vi laver som udgangspunkt en stikprøvekontrol, hvor der automatisk udvælges fem tilfældige sider fra hver enkelt mikrofilm. Fem sider er ikke meget, når en film snildt kan rummer over 1.000 sider, men systematiske fejl vil med stor sandsynlighed blive afsløret ved hjælp af de fem sider. Vi kan efter behov se på flere, men vores tidsforbrug skal begrænses, fordi Avissamlingens medarbejdere også har andre opgaver, så det sker ikke ofte. 32 mio. sider er så stor en mundfuld, at vi er nødt til at begrænse kontrollen. Med andre ord er indsatsen et kompromis mellem investeret tid, og hvor fejlfrit produktet bliver i den sidste ende.

QA_3.1

Operatører ved arbejdsstationerne i gang med manuel QA.

STIKPRØVEKONTROL AF FILER

De fem stikprøver vises i en særlig brugergrænseflade udviklet af vores leverandør Ninestars, som også står for digitaliseringen. Operatøren vurderer hvert billede ud fra nogle fastsatte kriterier om scanningskvalitet, formidlingskvalitet (læsbarhed) og ikke mindst hvor egnet billedet er som sikkerheds-kopi for den trykte avis. Fejl på originalaviser, som kan ses på scanningen, noteres også. Det kan fx være sider, som er ældet, hullet eller afrevet så meget, at teksten ikke kan læses.

Sammen med hver film følger et scannet ISO-test-ark, som kontrolleres inden de fem stikprøver. Det viser, om scanneren har kørt optimalt. Stikprøvekontrollen giver også mulighed for at vurdere, om mikrofilm-negativerne er ekstraordinært slidte eller beskadigede. På den måde giver processen os en større viden om tilstanden af vores mikrofilmsamling.

Ud over vurderingen af scanningskvaliteten laver vi en manuel vurdering af de fejl, som den automatiske og serverbaserede kontrol har fundet. En stor del af disse fejl er såkaldte falske positiver som fx sider, den automatiske kontrol har vurderet til at være for brede, men som ved efterfølgende check viser sig at være avisopslag, hvor der er tekst eller billeder, som går ind over midten på avisopslaget. (Se også Kåre Fiedler Christiansens indlæg “Hvad sker der med aviserne, når vi modtager dem fra Ninestars?”)

QA_fejlkoder

En side kan tagges med en fejlbeskrivelse samt tilføjes kommentar.

KONTROL AF METADATA

Vores leverandør Ninestars’ medarbejdere noterer manuelt en del metadata om aviserne, herunder titel og udgivelsesdato. En avisudgivelse kan fx få tilskrevet en forkert dato. Det kan skyldes en menneskelig fejl hos Ninestars, men det skyldes oftere en satsfejl på originalavisen, og det kan vi af gode grunde ikke ændre på. I den manuelle kontrol laver vi en kontrol af det generelle flow i udgivelsesdatoer for at vurdere eventuelle mangler, der kan skyldes filmnings- eller scanningsfejl, eller mere sandsynligt at avisen rent faktisk ikke er udkommet fx pga. strejke. Værktøjet, vi benytter her, er den kalenderoversigt, som er beskrevet i indlægget ”Hvad sker der med aviserne, når vi modtager dem fra Ninestars?”.

Modtager vi filer, som har fejl i kvalitet eller metadata, der kan skyldes Ninestars’ arbejde, skal de levere en ny, rettet version. På baggrund af vores kontrol og gode kommunikation med leverandøren har vi opnået et meget acceptabelt niveau for fejl og genleveringer.

Read Full Post »

Toke Eskildsen

De næste par indlæg kommer til at handle om kvalitetskontrol og kvalitetssikring af de digitaliserede avissider. Vi starter med at løfte lidt af fligen for arbejdet og fortæller lidt om, hvordan vi undersøger billedkvaliteten af de skannede sider.

En af vores dygtige it-folk, Toke Eskildsen, har været involveret i processen fra starten, og vi har valgt at lave en kort video med ham, hvor han beretter om sit arbejde med at sætte den korrekte standard for kvaliteten af billederne.

Toke er tidligere blevet interviewet om sit arbejde med avissiderne, og artiklen ”Råt er godt” om ham udkom oprindeligt i DenGANG nr. 2.  Se de øvrige numre af DenGANG.

I næste blogindlæg dykker vi ned i it-systemerne og kigger nærmere på den automatiske kvalitetskontrol.

Read Full Post »

Klappet og klar!

AluKasser1

Sådan ser det ud, når to aluminiumskasser fyldt med 52 batches med mikrofilm er klar til at blive afhentet af Scanning.dk. Hvert batch indeholder ca. 15.000 avissider, så i alt ligger der ca. imponerende 780.000 avissider i de to kasser fordelt på Information og Aalborg Stiftstidende.

Read Full Post »

COLOURBOX5230550

Der er ingen tvivl om det – avisdigitaliseringsprojektet er stort. Stort på antal af sider, stort på kompleksitet, stort på brugerinteresse og stort på potentiale. For Statsbiblioteket som institution er det også stort. Det er første gang, at vi binder an med et digitaliseringsprojekt af denne størrelse, og det involverer mange forskellige ansatte med vidt forskellige kompetencer.

I efteråret 2013 besluttede vi derfor, at projektet skulle dokumenteres. Ikke blot for at kunne fortælle vores eksterne interessenter om projektet, men også for bl.a. at kunne tage nogle øjebliksbilleder som senere kan findes frem og studeres nærmere. Der er lavet interviews med nøglepersoner, processer er blevet dokumenteret skriftligt, og højdepunkter er blevet filmet.

Pilotfasen er en af de processer, som vi har valgt at dokumentere på video. Og nu er videoen klar til at blive delt med resten af omverdenen. Så kom med os på en tur fra afsendelse af mikrofilmene i 3. kælder til Ninestars’ kontor i Hamborg og tilbage til Aarhus igen med modtagelse af de digitaliserede avissider.

Se videoen – Pilotfasen i levende billeder (lang udgave og kort udgave)

Vi arbejder videre med at dokumentere projektet, så forvent flere videoer, billeder og beskrivelser fra os i den kommende måneder og år.

Read Full Post »

Fredag 1. november 2013 var en god dag. Den dag hentede vores leverandør Ninestars nemlig de mikrofilm, der skal bruges til pilotprojektet. I alt har vi sendt fem titler, fordelt på ca. 296 film, af sted til digitalisering. Vi har udvalgt eksempler på aviser fra Berlingske Tidende, Adresseavisen, Aarhus Stiftstidende, Aktuelt og Morgenavisen-Jyllandsposten.

avisblog_Statsbiblioteket.5

Formålet med pilotfasen er bl.a. at afprøve spændevidden i digitaliseringssystemernes håndtering af de forskellige typer af aviser og mikrofilm. Vi har fx udvalgt eksempler på aviser fra forskellige tidsperioder (fra 1749 til 2002), i forskellige formater (fra 22×18 cm til 61×47 cm) og forskellige fonte (fraktur og latin). Desuden har vi også valgt mikrofilm af både god og dårlig kvalitet. Det sidste for at få afprøvet, hvor meget kvaliteten kan optimeres, selv om mikrofilmen i udgangspunktet er dårlig.

Mikrofilm til pilotprojekt udvalg

Vi glæder os til at kunne fortælle mere, når vi har modtaget de første resultater fra pilotfasen.

Read Full Post »

Older Posts »

%d bloggers like this: