Zelf metadateren, is dat nog wel nodig?
Iedereen die met een beeldbank werkt is het er wel over eens, dat het metadateren van assets een klusje is dat ze het liefst door een ander zouden laten doen. Toch is dit de meest waardevolle functie van een beeldbank, omdat hiermee de foto’s, tekeningen, illustraties, etc. terug gevonden kunnen worden.
Ondanks dat het werk zeer gewaardeerd wordt kan het langdradig zijn en zeker bij grote aantallen kan het zelfs ronduit saai zijn.
Makers van beeldbanken doen er alles aan om het metadateren zo eenvoudig mogelijk te maken door bijvoorbeeld meerdere assets tegelijkertijd van dezelfde metadata te voorzien. Dit is vooral handig bij series, waarbij het grootste deel van de metadata overeenkomt.
Helaas kan dit niet voorkomen dat de asset-specifieke metadata alsnog toegevoegd moet worden, per asset. Hoewel dit veel minder werk is dan alle metadata per asset toe te voegen, kan het nog steeds flink in de uren lopen bij grote aantallen.
Om zelf niet meer te hoeven metadateren zijn er feitelijk 2 opties;
1) Uitbesteden
Voor bedrijven die weinig mensen in dienst hebben, of geen tijd (of zin) hebben om hun assets zelf te metadateren, biedt DAMsupport de dienst om de assets voor hen te metadateren voor een zeer concurrerend tarief. Aan de hand van te maken afspraken worden de aangeleverde assets gemetadateerd volgens de IPTC / XMP standaarden. Eenvoudig, zorgvuldig, zorgeloos en accuraat!
2) Automatisch metadateren
Al enige tijd is het mogelijk om je foto’s automatisch te laten metadateren. Hiertoe stuur je een foto naar een server die de foto vervolgens interpreteert en de metadata terugstuurt. DAMsupport volgt deze techniek al een tijdje, maar het resultaat was nog niet dusdanig dat het écht nieuws was voor de Nederlandse markt; al was het alleen al vanwege het ontbreken van goede Nederlandse trefwoorden.
Tot nu toe…
In de laatste maanden van 2016 heb ik voor MediaFiler een beeldbank geïmplementeerd met de automatische metadateertool van Clarifai en ik moet zeggen dat ik onder de indruk was van de nauwkeurigheid van de trefwoorden.
Deze nauwkeurigheid is overigens zelf in te stellen, maar met het stijgen van de nauwkeurigheid, neemt (logischerwijs) het aantal trefwoorden af. Je kunt de kwaliteit beïnvloeden door zelf een thema mee te geven, waardoor de trefwoorden nog nauwkeuriger worden.
Zijn er dan geen nadelen?
Jazeker! Er zijn 2 nadelen te vinden aan tools als die van Clarifai; Ten eerste staat de server in Amerika en om te metadateren moet je dus een (low-res) versie van de foto naar Amerika sturen. Gezien o.a. de Patriot Act, kan dit voor overheden en veel andere bedrijven al een showstopper zijn.
Het tweede nadeel is, dat de trefwoorden alleen betrekking hebben op wat er op de foto te zien is. Dit klinkt voor de hand liggend, maar vaak is de belangrijkste metadata van een foto wat niet op de foto staat.
Ter illustratie heb ik een foto uit mijn eigen bestand genomen en deze laten metadateren door Clarifai.
Deze foto is gemaakt tijdens de startende tijdrit van de Giro d’Italia in Apeldoorn.
De Nederlandse trefwoorden die Clarifai toekent zijn de volgende:
90% waarschijnlijkheid (standaard)
wedstrijd, motorfiets, competitie, wiel, voertuig, haasten, volk, fietser, biker, sport, weg, zitten, actie, snel, motion (nog niet vertaald?), atleet, recreatie, mannelijk, straat, lichaamsbeweging.
95% waarschijnlijkheid (maximum)
wedstrijd, motorfiets, competitie, wiel, voertuig, haasten, volk, fietser, biker, sport, weg, zitten, actie
In het groen zijn de trefwoorden aangegeven die een goede match zijn met de afbeelding. De blauwe trefwoorden zijn in principe van toepassing, maar hebben een lage toegevoegde waarde en de rode trefwoorden zou ik adviseren achterwege te laten.
Het valt op dat ook trefwoorden die een goede match zijn, uiteindelijk toch afvallen als je voor meer nauwkeurigheid gaat.
De metadata die Clarifai niet uit de foto kan halen, maar die wel van belang zijn, zijn in dit geval: Giro d’Italia 2016, Apeldoorn, tijdrit, Jachtlaan, Valerio Conti, Lampre, volgauto…
Om dit toe te kunnen voegen moet de techniek een heel stuk verder zijn (gps gegevens uitlezen en herleiden naar locatie, evenementenkalender van alle evenementen in de hele wereld nalopen a.d.h.v. gps en datum, etc.) De vraag is of dit ooit betaalbaar wordt en hoe wenselijk dit is.
Conclusie
Het metadateren met behulp van een tool als Clarifai werkt behoorlijk goed voor metadata over de onderwerpen op de foto en direct af te leiden trefwoorden. Hoe dan ook is het van belang om achteraf de trefwoorden door te lopen. Zelfs met de hoogste waarschijnlijkheid bevat de retour gestuurde metadata nog altijd een aantal trefwoorden die weinig met het onderwerp te maken hebben. Hoeveel dit er zijn, hangt erg af van het onderwerp. Nakijken blijft dus wel nodig om de metadata zuiver te houden.
Clarifai en soortgelijke software kunnen nog niet het handmatig metadateren vervangen, maar kunnen wel een hele goede start geven bij grote metadateerklussen.
Met automatisch metadateren wordt er een goede basis gelegd welke beoordeeld kan worden. Dit is vaak eenvoudiger dan het zelf bedenken.
Het bedrijf dat als eerste een metadateerserver in Nederland (of Europa) plaatst, kan wel eens een grote klapper maken. Dit soort diensten gaan een waardevolle aanvulling worden voor alle beeldbanken!
Video
Clarifai kan ook video’s metadateren. Ik heb dit echter nog niet voldoende kunnen testen om hier iets over te schrijven. Wellicht in een volgende blog!