Her følger indlæg nummer tre om kvalitetscheck af de digitaliserede avissider. Denne gang med gæsteskribenter fra Statens Avissamling, Christian Brink Christensen og Martin Lund.
STATENS AVISSAMLING
Vi har valgt Statens Avissamling i Skejby som stedet, hvor der udføres manuel kontrol af de digitaliserede aviser, også kaldet QA – quality assessment, på dansk kvalitetsvurdering. Her er Statsbibliotekets magasin med de trykte aviser fra 1668 og frem, og her er medarbejdere, der ved meget om både aviser og mikrofilm. Avisdigitaliseringen er baseret på mikrofilm, som er fremstillet igennem de seneste 50 år. Mikrofilmene er af varierende kvalitet og giver derfor også scanninger af varierende kvalitet. Kendskab til hvorfor og hvordan det kommer til udtryk, er en stor fordel, når vi kvalitetsvurderer de digitaliserede sider.
OMFANG AF MANUEL KONTROL
Vi laver som udgangspunkt en stikprøvekontrol, hvor der automatisk udvælges fem tilfældige sider fra hver enkelt mikrofilm. Fem sider er ikke meget, når en film snildt kan rummer over 1.000 sider, men systematiske fejl vil med stor sandsynlighed blive afsløret ved hjælp af de fem sider. Vi kan efter behov se på flere, men vores tidsforbrug skal begrænses, fordi Avissamlingens medarbejdere også har andre opgaver, så det sker ikke ofte. 32 mio. sider er så stor en mundfuld, at vi er nødt til at begrænse kontrollen. Med andre ord er indsatsen et kompromis mellem investeret tid, og hvor fejlfrit produktet bliver i den sidste ende.
Operatører ved arbejdsstationerne i gang med manuel QA.
STIKPRØVEKONTROL AF FILER
De fem stikprøver vises i en særlig brugergrænseflade udviklet af vores leverandør Ninestars, som også står for digitaliseringen. Operatøren vurderer hvert billede ud fra nogle fastsatte kriterier om scanningskvalitet, formidlingskvalitet (læsbarhed) og ikke mindst hvor egnet billedet er som sikkerheds-kopi for den trykte avis. Fejl på originalaviser, som kan ses på scanningen, noteres også. Det kan fx være sider, som er ældet, hullet eller afrevet så meget, at teksten ikke kan læses.
Sammen med hver film følger et scannet ISO-test-ark, som kontrolleres inden de fem stikprøver. Det viser, om scanneren har kørt optimalt. Stikprøvekontrollen giver også mulighed for at vurdere, om mikrofilm-negativerne er ekstraordinært slidte eller beskadigede. På den måde giver processen os en større viden om tilstanden af vores mikrofilmsamling.
Ud over vurderingen af scanningskvaliteten laver vi en manuel vurdering af de fejl, som den automatiske og serverbaserede kontrol har fundet. En stor del af disse fejl er såkaldte falske positiver som fx sider, den automatiske kontrol har vurderet til at være for brede, men som ved efterfølgende check viser sig at være avisopslag, hvor der er tekst eller billeder, som går ind over midten på avisopslaget. (Se også Kåre Fiedler Christiansens indlæg “Hvad sker der med aviserne, når vi modtager dem fra Ninestars?”)
En side kan tagges med en fejlbeskrivelse samt tilføjes kommentar.
KONTROL AF METADATA
Vores leverandør Ninestars’ medarbejdere noterer manuelt en del metadata om aviserne, herunder titel og udgivelsesdato. En avisudgivelse kan fx få tilskrevet en forkert dato. Det kan skyldes en menneskelig fejl hos Ninestars, men det skyldes oftere en satsfejl på originalavisen, og det kan vi af gode grunde ikke ændre på. I den manuelle kontrol laver vi en kontrol af det generelle flow i udgivelsesdatoer for at vurdere eventuelle mangler, der kan skyldes filmnings- eller scanningsfejl, eller mere sandsynligt at avisen rent faktisk ikke er udkommet fx pga. strejke. Værktøjet, vi benytter her, er den kalenderoversigt, som er beskrevet i indlægget ”Hvad sker der med aviserne, når vi modtager dem fra Ninestars?”.
Modtager vi filer, som har fejl i kvalitet eller metadata, der kan skyldes Ninestars’ arbejde, skal de levere en ny, rettet version. På baggrund af vores kontrol og gode kommunikation med leverandøren har vi opnået et meget acceptabelt niveau for fejl og genleveringer.