Inzicht in de eigen trefwoorden

Blogreeks 'Aan de slag met termen' - deel 1

Door Iris Dracht

Het verbinden van je collectie met termen in plaats van trefwoorden zal binnen Brabant Cloud de belangrijkste ontwikkeling worden voor de komende 10 jaar. Termen bieden namelijk een oplossing voor twee grote problemen die je nu tegenkomt bij het zoeken naar Brabantse erfgoedinformatie: vindbaarheid en identificatie. Want hoe weet je zeker of je álle en ook nog eens de júíste informatie gevonden hebt met één zoekopdracht? Een object kan dezelfde naam hebben, maar een andere betekenis. Of een object kan onder verschillende namen bekend staan. In deze blogreeks ‘Aan de slag met termen’ gaan we in op het vervangen van eigen trefwoorden door termen en wat daar allemaal bij komt kijken.

Van trefwoorden naar termen

Wanneer een term aan een record gekoppeld is, weet je namelijk wel naar welk specifiek object verwezen wordt. Een term is een beschrijving die een begrip of entiteit uniek identificeert en de betekenis ervan ondubbelzinnig duidelijk maakt. Dat betekent dat in een termenlijst per term een unieke identificatiecode en extra definiërende informatie, zoals een definitie en alternatieve namen, worden vastgelegd.

Hierin zit ook het verschil verscholen tussen termen en eigen trefwoorden. Een eigen trefwoord is letterlijk een woord, bijvoorbeeld 'Alphen'. De term, daarentegen, bestaat uit het woord en een identificatiecode. Deze code maakt duidelijk dat het Alphen in Noord-Brabant betreft en niet het gelijknamige dorp in Gelderland. Het zijn precies deze codes die je moet gebruiken in je collectieregistratie: zo kun je ondubbelzinnig aangeven wat je bedoelt. En doordat alle erfgoedinformatie uit verschillende bronnen wordt gekoppeld aan dezelfde termen, weet je direct dat je alle informatie gevonden hebt.

Wil je meer over termen en termenlijsten weten? Op onze helppagina ‘Aan de slag met termen en termenlijsten’ leggen we verder uit wat termen zijn en hoe je de beschikbare termenlijsten in Memorix Maior kunt gebruiken. En in onze blogreeks 'Vinden door te verbinden' wordt uitgebreid uitgelegd wat termen en termenlijsten precies zijn en wordt verteld over de termenlijst Brabantse gebouwen die Erfgoed Brabant aan het aanleggen is voor de deelnemers van Brabant Cloud. De blogreeks beschrijft hoe de termenlijst is ontstaan en waarvoor deze te gebruiken is.

Verbeteren op lokaal niveau bij Heemkundekring Gemert. (Foto: Cris Kremers)

Heemkundekring De Kommanderij Gemert werkt aan het verbeteren van de termenlijst Brabantse Gebouwen. (Foto: Cris Kremers)

Alle rechten voorbehouden

Keuzestress: 73.831 termen in de Art & Architecture Thesaurus

Eén van de termenlijsten die in Memorix Maior voor onze deelnemers beschikbaar is, is de de Art & Architecture Thesaurus (AAT). Deze termenlijst wordt wereldwijd gebruikt voor het beschrijven en toegankelijk maken van cultureel erfgoed, zoals documenten, archivalia, foto’s, boeken en objecten. Kortom, cultureel erfgoed dat door mensen is gemaakt. Alle termen in de AAT zijn in te delen in zeven hoofdgroepen: abstracte begrippen, activiteiten, fysieke kenmerken, materialen, objecten, actoren en organismen, stijlen en perioden. Er staan geen termen in over gebeurtenissen of dieren. Zo staat de term “wereldoorlogen” als activiteit in de AAT, maar komt de gebeurtenis “Tweede Wereldoorlog” niet voor in de AAT.

De AAT in Memorix Maior gekoppeld aan de velden Onderwerp (AAT), Materiaal (AAT), Techniek (AAT), Objectnaam (AAT) en Type Document (AAT). In deze velden kun je dus termen uit de AAT selecteren om je collectie gestructureerd mee te registreren. Echter, om de grote verscheidenheid aan cultureel erfgoed goed te kunnen beschrijven, zijn er logischerwijs veel termen in gebruik. Op dit moment staat de teller op 73.831 termen in de AAT (Bron: Getty Research Institute). Dit kan in het begin een overweldigende hoeveelheid termen zijn, waarin je door de bomen het bos niet meer ziet. Welke termen passen nu bij jouw collectie? Daarvoor is het niet alleen goed om de tijd te nemen om de AAT te leren kennen, maar ook om het is ook goed om op de hoogte te zijn van je eigen trefwoordengebruik.  

Scherm­afbeelding van de velden Materiaal (AAT) en Techniek (AAT) in Memorix Maior.

Scherm­afbeelding van de velden Materiaal (AAT) en Techniek (AAT) in Memorix Maior. In Memorix Maior kun je in de AAT-velden termen uit de AAT selecteren om je collectie mee te beschrijven. (Bron: Erfgoed Brabant)

Alle rechten voorbehouden

Terug naar de basis: ken je eigen trefwoordgebruik

Bekijk daarom welke trefwoorden jullie in gebruik hebben voor onderwerpen, materialen, technieken, objectnamen en type documenten. Dit is ook een kans om nog eens kritisch te kijken naar je eigen trefwoordengebruik. Bevat de lijst geen synoniemen? Is er geen overlap met zaken die je al in een ander veld vastlegt? Waar wil je dat het object op teruggevonden wordt? Zo kun je vaststellen waar eventueel nog verbeteringen in je trefwoordgebruik aan te brengen zijn. Kijk daarna of je een lijst kunt opstellen van alle trefwoorden die voor jouw collectie nodig zijn. Met die lijst in de hand weet je namelijk naar welke soort termen je in de termenlijst op zoek moet.

Overzicht: het trefwoordgebruik Brabant-breed

Om de deelnemers van Brabant Cloud goed te kunnen ondersteunen is Erfgoed Brabant precies dit, inzicht verkrijgen in de gebruikte trefwoorden, nu ook Brabant-breed aan het doen. Door deelnemers van Brabant Cloud is al jarenlang hard gewerkt aan de collectieregistratie en zo zijn er via Brabant Cloud al ruim 1,7 miljoen gepubliceerde collectie-items. Die 1,7 miljoen collectie-items zijn veelal nog niet voorzien van termen, maar ze zijn wel geregistreerd met eigen trefwoorden. Welke trefwoorden zijn dit? En zijn die om te zetten naar termen?

Om hierachter te komen hebben we een content dashboard laten ontwikkelen. In dit dashboard is alle gepubliceerde data in Brabant Cloud samengebracht. Dit klinkt misschien alsof we een tweede brabantserfgoed.nl hebben gemaakt, maar dat is niet zo. Brabantserfgoed.nl is ontwikkeld als portaal om in collecties te zoeken en collectie-items te kunnen bekijken en vinden. Dit dashboard heeft als doel inzicht te krijgen in de collectiebeschrijvingen, oftewel de metadata, van deze collectie-items.

Schermafbeelding van het realtime content Dashboard

Schermafbeelding van het realtime content Dashboard. (Bron: Erfgoed Brabant)

Alle rechten voorbehouden

In het dashboard zien we dus geen afzonderlijke objecten en hun afbeeldingen, maar we kunnen met behulp van grafieken en filtermogelijkheden alle ruim 1,7 miljoen collectiebeschrijvingen analyseren. Zo kunnen we bijvoorbeeld in één oogopslag zien wat de vijfhonderd meest gebruikte onderwerpen of collectienamen zijn of welke technieken er zijn ingevuld bij de gepubliceerde records in de entiteit Objecten. Deze grafieken kunnen we uitsplitsen per instelling en/of per entiteit, zo krijg je inzicht per collectie en verschillende soorten objecten. Ook kunnen we juist een Brabant-breed overzicht creëren door een analyse te doen op alle collectiedata van onze deelnemers tezamen.

Het resultaat: een 0-meting

Zo zien we bijvoorbeeld dat enkele van de meest gebruikte techniek- en materiaaltrefwoorden onder onze deelnemers zijn: ‘geschetst’, ‘getekend’ en ‘ingekleurd’ voor techniek en ‘papier’ en ‘hout’ voor materiaal. Ga je op onderzoek uit in de AAT, dan zie je dat deze trefwoorden door termen te vervangen zijn. In de AAT zijn namelijk de termen ‘schetsen (techniek)' met het ID 300053576, ‘tekenen' met het ID 300054196 en kleuren (procedé)' met het ID 300053043 voor techniek te vinden en ‘papier (vezelproduct)’ met het ID 300014109 en ‘hout (plantaardig materiaal)’ met het ID 300011914 voor materiaal te vinden.

Met dit dashboard hebben we dus een 0-meting kunnen uitvoeren. We hebben nu per (trefwoorden)veld in Memorix Maior een lijst van de meest gebruikte eigen trefwoorden en inzicht in hoe vaak ze zijn gebruikt. Wat leren we uit deze trefwoorden en kan Erfgoed Brabant concrete suggesties geven hoe die trefwoorden te vervangen zijn door termen? Hierover lezen jullie meer in een volgende blog.