Onderzoek naar de (on)mogelijkheden van AI

24 februari 2025  
Een robot arm en mensen arm strekken zich naar elkaar uit. In het midden van de foto raken de twee wijsvingers elkaar aan.

Kunstmatige intelligentie (AI) ontwikkelt zich razendsnel en wordt steeds vaker ingezet voor audiovisuele producties. Maar kan AI ook een rol spelen bij het maken van audiodescriptie (AD) voor film en televisie? Een recent onderzoek van Scribit.Pro, uitgevoerd in opdracht van het Bartiméus Fonds en met steun van CFAP en NPO Innovatie, biedt nieuwe inzichten. De onderzoeksresultaten tonen aan dat AI veelbelovende toepassingen biedt, maar voor verhalende content nog tekortschiet.


Wat is audiodescriptie en waarom is het belangrijk?

Audiodescriptie maakt films en televisie toegankelijk voor mensen met een visuele beperking door beschrijvingen toe te voegen van wat er in beeld gebeurt. Een goede audiodescriptie brengt niet alleen visuele elementen over, maar vertaalt ook sfeer, emotie en nuances die essentieel zijn voor de beleving van een verhaal.

AI en audiodescriptie: de mogelijkheden en beperkingen

Het onderzoek maakte gebruik van ChatGPT-4o, momenteel het meest geavanceerde AI-model voor beeldbeschrijving. Andere modellen, zoals Google Gemini en Anthropic Claude, bleken niet geschikt voor het genereren van bruikbare audiodescriptie.

Door middel van geavanceerde ‘prompt engineering’ werden aanzienlijke verbeteringen bereikt in de output van AI. Het gebruik van een filmscript en ondertiteling zorgde voor meer context, waardoor de beschrijvingen beter aansloten bij de beelden. Toch bleef AI moeite houden met narratieve nuances en het herkennen van subtiele visuele details. Dit resulteerde vaak in beschrijvingen die te oppervlakkig of juist te gedetailleerd waren, zonder de juiste focus op wat echt belangrijk is voor de kijker.


Hoe beoordelen gebruikers en professionals AI-audiodescriptie?

Een cruciaal onderdeel van het onderzoek was de beoordeling van AI-gegenereerde audiodescriptie door eindgebruikers en professionals. De korte film Der Kaiser (NTR Kort) werd met AI-audiodescriptie beoordeeld met een 6,5 door mensen met een visuele beperking. Zonder audiodescriptie kreeg de film een 3,5, terwijl de menselijke audiodescriptie een 9,1 scoorde.

Hoewel AI dus een duidelijke verbetering biedt ten opzichte van helemaal geen audiodescriptie, vonden gebruikers de AI-beschrijvingen vaak te druk, herhalend en minder goed afgestemd op de filmervaring. Professionele beeldbeschrijvers van Scribit.Pro zien wel mogelijkheden om AI in te zetten als hulpmiddel, maar wijzen erop dat volledige automatisering nog niet haalbaar is. Vooral bij animatiefilms en dramaproducties voegt AI nauwelijks bruikbare audiodescriptie toe, en is er veel nabewerking nodig.

Documentaires bleken geschikter voor AI-audiodescriptie, waarbij 60-80% van de gegenereerde tekst bruikbaar was met menselijke controle en redactie.

De toekomst van AI in audiodescriptie

Voorlopig is AI niet geschikt voor audiodescriptie van dramafilms en andere verhalende content, omdat het gebrek aan context en begrip van narratieve structuren nog te groot is. In documentaireproducties en informatieve content kan AI echter een ondersteunende rol spelen, mits er een menselijke redacteur betrokken blijft.

De ontwikkelingen in AI gaan echter snel. Opkomende modellen, zoals het open-source DeepSeek, tonen aan dat er grote vooruitgang wordt geboekt. De onderzoekers adviseren dan ook om de technologische ontwikkelingen goed te blijven volgen en te blijven experimenteren met nieuwe AI-tools.

Meer weten? Download hier de samenvatting van het onderzoek.

Wil je op de hoogte blijven over de ontwikkelingen van AI en AD? Abonneer je op onze nieuwsbrief.

Schrijf je in op onze nieuwsbrief