Archiefgebruikers willen iets moois vinden, zoals shows van André van Duin of kaarten van hun woonplek. Soms stellen ze een vraag, zoals “hoeveel films zijn gedigitaliseerd?” of “wat is de oudste kaart van mijn woonplek?”
Als AV-collectiebeheerder weet je dat deze taken vaak lastig zijn, soms zelfs onmogelijk. Dat komt door metadatabreuken. Maar wat zijn metadatabreuken en hoe werken ze door in de bruikbaarheid van je collectiemateriaal? En hoe kun je daarmee omgaan? We leggen het uit aan de hand van de collectie van Beeld & Geluid.
Wat zijn metadata?
Metadata zijn data die een archiefitem beschrijven, zoals de titel of samenvatting. Zonder metadata is het nagenoeg onmogelijk om iets te vinden in het archief.
Metadata hebben veel verschillende bronnen. Ze worden geleverd samen met een archiefitem, later handmatig toegevoegd of automatisch gegenereerd, zoals de datum waarop een bestand is geüpload. Steeds vaker worden metadata geëxtraheerd uit het materiaal zelf, bijvoorbeeld door woorden te detecteren in handgeschreven tekst.
Wat zijn metadatabreuken?
Verschillen in hoe metadata zijn vastgelegd noemen we metadatabreuken. Ze ontstaan door veranderende selectiepraktijken, door verschillende manieren om metadata vast te leggen en door veranderingen over de tijd heen:
- Selectie van materiaal: het grootste verschil in metadata is of het archief kiest om een item te bewaren of niet. Een item dat niet bewaard is, heeft natuurlijk geen metadata.
- Verschillende manieren van metadatering: verschillende manieren produceren verschillende metadata. Zo tagt een algoritme programma’s met de term ‘klimaat’ wanneer dat woord wordt gezegd, terwijl een archivist programma’s tagt met de term ‘klimaat’ omdat het onderwerp daarin wordt besproken, ook al komt het woord zelf nooit voor. Verschillen in type (bijv. papier of audio) en prioriteit van een item leiden tot verschillende keuzes voor de manier van metadatering – en dus ook tot verschillende metadata.
- Veranderingen over tijd heen: archiefbeleid rondom metadatering verandert over de tijd heen, wanneer selectiebeleid wordt aangepast, nieuwe manieren van metadatering worden ingevoerd of richtlijnen worden geüpdatet. Bij elke verandering ontstaat er een metadatabreuk.
Impact van metadatabreuken
Metadata zijn de lens waardoor we naar het archief kijken. Metadatabreuken zijn krassen op deze lens die ons zicht op het archief verstoren. Dat heeft gevolgen voor gebruikers:
- Impact op vinden: selectie heeft de grootste impact – je kunt niet vinden wat niet is bewaard. Dit lijkt een open deur, maar voor gebruikers die niet weten hoe de selectie is gedaan, kan het enorm verwarrend en frustrerend zijn wanneer ze niet vinden wat ze zoeken. Manieren van metadatering hebben ook gevolgen voor de vindbaarheid. Een item met een gedetailleerde beschrijving is veel makkelijker te vinden dan een item met alleen summiere informatie. Verschillen over tijd of tussen categorieën maken het lastig om alle relevante items te vinden. Bij Beeld & Geluid kun je bijvoorbeeld recente nieuwsprogramma’s met een bepaalde persoon vinden door te zoeken in de gezichtsherkenning. Maar dit geldt niet voor personen in nieuwsprogramma’s van voor 2020, en ook ook niet voor personen in spelprogramma’s omdat gezichtsherkenning niet wordt toegepast op die categorie van programma’s.
- Impact op vragen stellen: om vragen te beantwoorden, heb je graag een compleet beeld. Door metadatabreuken vallen vaak stukken van het beeld weg. Het is essentieel om je daarvan bewust te zijn. Neem een onderzoek naar welke omroep de meeste programma’s uitzond in hun eerste jaar. Dit kan alleen voor omroepen die na 2006 zijn opgericht, omdat Beeld & Geluid voor die tijd niet alle programma’s bewaarde. Veranderingen over de tijd spelen ook mee. Bijvoorbeeld de verandering in de spelling van plaatsnamen. Zo wordt het moeilijker voor een gebruiker om er achter te komen welke de oudste kaart van zijn of haar woonplek is.
In actie tegen de effecten van metadatabreuken
Metadatabreuken kun je nooit voorkomen, maar je kunt de effecten ervan wel verminderen met de volgende acties:
- Wees bewust van het feit dat alle verschillen in metadataprocessen en elke verandering in die processen, metadatabreuken veroorzaken. Zelfs als het gaat om een verbetering.
- Breng metadatabreuken in kaart door de kennis over metadatabreuken op te graven uit oude documentatie en de hoofden van je experts. Het invoeren van nieuwe processen of technologie is een uitstekend moment om vast te leggen welke metadatabreuken deze verandering veroorzaakt.
- Communiceer met je gebruikers over metadatabreuken en het effect dat ze hebben. Met een blogpost of presentatie, of tijdens een samenwerking. Voeg informatie over metadatabreuken toe aan je tools: denk bijvoorbeeld aan een pop-up bij de resultaten voor een zoekterm die waarschuwt dat er tijdens een bepaalde periode überhaupt geen items aanwezig zijn in het archief. Praat ook met je archiefcollega’s die mogelijk metadatabreuken kunnen wegwerken, bijvoorbeeld door gaten in de selectie te vullen of nieuwe metadata te genereren.
Kortom…
Metadatabreuken zijn onvermijdelijk en inherent aan onze rijke en historische AV-archiefcollecties die over de tijd groeien en zich ontwikkelen. Metadatabreuken hebben een impact op de bruikbaarheid van collecties. Als AV-collectiebeheerder is het daarom belangrijk dat je je hiervan bewust bent, zodat je de diverse gebruikersgroepen van je collectie hierover goed kunt informeren.
We hopen dat we je met deze blog op weg hebben geholpen. Wil je meer weten over metadatabreuken en hoe ze doorwerken in de collectie van Beeld & Geluid? Lees Metadatabreuken – laat ze jouw werk niet afbreken!
Mari Wigham schreef deze blog in samenwerking met Tim Manders, Informatie adviseur bij Beeld & Geluid (tmanders@beeldengeluid.nl)