Data manager
Het KMMA is een centrum van kennis en hulpbronnen in verband met Afrika, in het bijzonder Centraal-Afrika, in een historische, hedendaagse en mondiale context. Het museum stelt unieke collecties tentoon. Het is een plaats van herinnering aan het koloniale verleden en streeft ernaar een dynamisch platform te zijn voor uitwisselingen en dialoog tussen culturen en generaties. In dit kader speelt het KMMA ook een sleutelrol in het behoud en de valorisatie van geologische en mijnbouw archieven met betrekking tot de Democratische Republiek Congo (DRC) die in het museum worden bewaard. Deze valorisatie wordt nu versneld door de betrokkenheid van het KMMA bij het Europese project PanAfGeo+.
- Koninklijk Museum voor Midden-Afrika, Tervuren
- Type: Voltijds
- Deadline: 20/11/2025
Over deze job
Deze functie heeft betrekking op de implementatie van een verwerkingsketen voor de classificatie van gegevens die uit een groot volume gedigitaliseerde documenten worden gehaald. Deze documenten zijn bestemd voor operationeel gebruik door archivarissen en geologen binnen het project, in samenwerking met Congolese instellingen. De beoogde OCR-tools zijn, in eerste instantie, Tesseract, in combinatie met modellen die toegankelijk zijn via de API’s Transformer en Hugging Face voor handgeschreven teksten.
De aangeworven kandidaat moet:
- De fysieke documenten analyseren om een dataset samen te stellen waarmee de modellen kunnen worden getest.
- De modellen testen en identificeren – beoordelen of de inferentie kan beginnen op basis van vooraf getrainde modellen of dat er specifieke training of verfijning van de modellen nodig is, en opzetten van die training of verfijning indien nodig.
- Instaan voor het definiëren en implementeren van een verwerkingsketen die de processen automatiseert op basis van digitalisering of gescande bestanden, waarbij er verschillende software-architecturen mogelijk zijn (server met API; directe verzending van bestanden, gegevensverzameling via werkstations).
- De beschikbare hardwarebronnen evalueren en de aanschaf van extra materiaal plannen om het project bij het MRAC en bij de projectpartners te kunnen uitvoeren.
- De geproduceerde gegevens indexeren en classificeren met het oog op hun invoering in PMB (target OPAC), zodat de archivarissen en geologen binnen het project de kwaliteit van de gegevens kunnen beoordelen en de definitieve validatie kunnen uitvoeren:
- trefwoorden uit de gegevens halen en indexeren om het zoeken tijdens de voorbereiding van de gegevens en in de target OPAC te vergemakkelijken,
- bestaande ontologieën en thesauri identificeren en relevante gegevens daaraan koppelen,
- de gegevens opmaken en voorbereiden voor batchgewijze invoer in de target OPAC.
Deze functie biedt een boeiende kans om een belangrijke bijdrage te leveren aan de exploratie en analyse van unieke geologische archieven over de DRC, met het oog op hun valorisatie in samenwerking met instellingen uit dat land. Dit initiatief past in de missie van het KMMA, die er onder meer op gericht is de toegang tot zijn collecties te verbeteren en langdurige wetenschappelijke samenwerking te ontwikkelen. Het doel is om zijn wetenschappelijk erfgoed te delen met het oog op het versterken van het economisch potentieel van de DRC in de dynamische context van de energietransitie.
Het KMMA zet zich in om al zijn medewerkers in staat te stellen hun volledige potentieel te benutten. We bevorderen en handhaven een inclusieve en gunstige omgeving zodat al onze medewerkers zich kunnen ontplooien.
Bijkomende info
Gepost op 2025-10-17