Feeds:
Indlæg
Kommentarer

Archive for the ‘kvalitetssikring’ Category

Fotograf: Henrik Storgaard Sørensen/Det Kgl. Bibliotek

Slut på den manuelle kontrol

Avisdigitaliseringsprojektet lakker så småt mod enden. De sidste mikrofilm er forlængst sendt af sted, og nu har vi også afsluttet den manuelle kontrol af de digitale filer.

I alt 200.000 af de mere end 35 mio. digitaliserede sider er blevet kontrolleret manuelt inden upload til Mediestream.

Kvalitetssikring

Sideløbende med den manuelle kvalitetskontrol er der foretaget en automatisk kontrol. Tilsammen har kontrollerne fanget mange fejl i både originalmaterialet, dvs. aviserne og mikrofilmene, og i metadata og billedfiler. Hvor det har været muligt, er fejlene blevet rettet af leverandøren, mens andre fejl først vil blive rettet senere, fx manglende numre.

Holdet i Statens Avissamling

På billedet øverst ses en del af det hold, der har udført opgaven siden januar 2014, trykke “godkendt” på den sidste side. Fra venstre er det Helle Røddik, Søren Bombæk, Vibe Kellermann, Henrik Storgaard Sørensen og Martin Lund, som alle arbejder med Statens Avissamling.

Read Full Post »

Her følger indlæg nummer tre om kvalitetscheck af de digitaliserede avissider. Denne gang med gæsteskribenter fra Statens Avissamling, Christian Brink Christensen og Martin Lund.

STATENS AVISSAMLING

Vi har valgt Statens Avissamling i Skejby som stedet, hvor der udføres manuel kontrol af de digitaliserede aviser, også kaldet QA – quality assessment, på dansk kvalitetsvurdering. Her er Statsbibliotekets magasin med de trykte aviser fra 1668 og frem, og her er medarbejdere, der ved meget om både aviser og mikrofilm. Avisdigitaliseringen er baseret på mikrofilm, som er fremstillet igennem de seneste 50 år. Mikrofilmene er af varierende kvalitet og giver derfor også scanninger af varierende kvalitet. Kendskab til hvorfor og hvordan det kommer til udtryk, er en stor fordel, når vi kvalitetsvurderer de digitaliserede sider.

OMFANG AF MANUEL KONTROL

Vi laver som udgangspunkt en stikprøvekontrol, hvor der automatisk udvælges fem tilfældige sider fra hver enkelt mikrofilm. Fem sider er ikke meget, når en film snildt kan rummer over 1.000 sider, men systematiske fejl vil med stor sandsynlighed blive afsløret ved hjælp af de fem sider. Vi kan efter behov se på flere, men vores tidsforbrug skal begrænses, fordi Avissamlingens medarbejdere også har andre opgaver, så det sker ikke ofte. 32 mio. sider er så stor en mundfuld, at vi er nødt til at begrænse kontrollen. Med andre ord er indsatsen et kompromis mellem investeret tid, og hvor fejlfrit produktet bliver i den sidste ende.

QA_3.1

Operatører ved arbejdsstationerne i gang med manuel QA.

STIKPRØVEKONTROL AF FILER

De fem stikprøver vises i en særlig brugergrænseflade udviklet af vores leverandør Ninestars, som også står for digitaliseringen. Operatøren vurderer hvert billede ud fra nogle fastsatte kriterier om scanningskvalitet, formidlingskvalitet (læsbarhed) og ikke mindst hvor egnet billedet er som sikkerheds-kopi for den trykte avis. Fejl på originalaviser, som kan ses på scanningen, noteres også. Det kan fx være sider, som er ældet, hullet eller afrevet så meget, at teksten ikke kan læses.

Sammen med hver film følger et scannet ISO-test-ark, som kontrolleres inden de fem stikprøver. Det viser, om scanneren har kørt optimalt. Stikprøvekontrollen giver også mulighed for at vurdere, om mikrofilm-negativerne er ekstraordinært slidte eller beskadigede. På den måde giver processen os en større viden om tilstanden af vores mikrofilmsamling.

Ud over vurderingen af scanningskvaliteten laver vi en manuel vurdering af de fejl, som den automatiske og serverbaserede kontrol har fundet. En stor del af disse fejl er såkaldte falske positiver som fx sider, den automatiske kontrol har vurderet til at være for brede, men som ved efterfølgende check viser sig at være avisopslag, hvor der er tekst eller billeder, som går ind over midten på avisopslaget. (Se også Kåre Fiedler Christiansens indlæg “Hvad sker der med aviserne, når vi modtager dem fra Ninestars?”)

QA_fejlkoder

En side kan tagges med en fejlbeskrivelse samt tilføjes kommentar.

KONTROL AF METADATA

Vores leverandør Ninestars’ medarbejdere noterer manuelt en del metadata om aviserne, herunder titel og udgivelsesdato. En avisudgivelse kan fx få tilskrevet en forkert dato. Det kan skyldes en menneskelig fejl hos Ninestars, men det skyldes oftere en satsfejl på originalavisen, og det kan vi af gode grunde ikke ændre på. I den manuelle kontrol laver vi en kontrol af det generelle flow i udgivelsesdatoer for at vurdere eventuelle mangler, der kan skyldes filmnings- eller scanningsfejl, eller mere sandsynligt at avisen rent faktisk ikke er udkommet fx pga. strejke. Værktøjet, vi benytter her, er den kalenderoversigt, som er beskrevet i indlægget ”Hvad sker der med aviserne, når vi modtager dem fra Ninestars?”.

Modtager vi filer, som har fejl i kvalitet eller metadata, der kan skyldes Ninestars’ arbejde, skal de levere en ny, rettet version. På baggrund af vores kontrol og gode kommunikation med leverandøren har vi opnået et meget acceptabelt niveau for fejl og genleveringer.

Read Full Post »

Toke Eskildsen

De næste par indlæg kommer til at handle om kvalitetskontrol og kvalitetssikring af de digitaliserede avissider. Vi starter med at løfte lidt af fligen for arbejdet og fortæller lidt om, hvordan vi undersøger billedkvaliteten af de skannede sider.

En af vores dygtige it-folk, Toke Eskildsen, har været involveret i processen fra starten, og vi har valgt at lave en kort video med ham, hvor han beretter om sit arbejde med at sætte den korrekte standard for kvaliteten af billederne.

Toke er tidligere blevet interviewet om sit arbejde med avissiderne, og artiklen ”Råt er godt” om ham udkom oprindeligt i DenGANG nr. 2.  Se de øvrige numre af DenGANG.

I næste blogindlæg dykker vi ned i it-systemerne og kigger nærmere på den automatiske kvalitetskontrol.

Read Full Post »

%d bloggers like this: