Nederlandse nieuwsuitgevers samenwerken aan verantwoord AI-taalmodel GPT-NL

den haag, vrijdag, 18 juli 2025.
Nederlandse nieuwsuitgevers hebben een omvangrijke verzameling nieuwsartikelen aangeleverd voor de training van het AI-taalmodel GPT-NL. Dit initiatief, een samenwerking tussen TNO, NDP Nieuwsmedia en andere instellingen, streeft ernaar een verantwoord en rechtmatig alternatief te bieden voor bestaande AI-modellen. De dataset bevat meer dan 20 miljard tokens en zal helpen om de positie van de journalistiek in Nederland te verstevigen, terwijl het voldoet aan Europese wet- en regelgeving. De training van GPT-NL begon in juni 2025 en wordt verder verbeterd voor het eerste gebruik in het vierde kwartaal van dit jaar.

Een verantwoord alternatief

GPT-NL is een initiatief van non-profitorganisaties TNO, NFI en SURF, ontwikkeld voor Nederland met hoogwaardige Nederlandse data. Het model voldoet aan Europese wet- en regelgeving, zoals de AI-Act, en betaalt uitgevers voor gebruik van hun content. Dit staat in schril contrast met veel internationale modellen van Big Tech, die vaak worden getraind op nieuwsartikelen zonder toestemming of vergoeding [1][2][3].

Samenwerking en data

De Nederlandse nieuwsuitgevers, vertegenwoordigd door NDP Nieuwsmedia, hebben een grote verzameling nieuwsartikelen aangeleverd voor de training van GPT-NL. Deze dataset omvat meer dan 20 miljard tokens, afkomstig van meer dan 30 landelijke en regionale nieuwsbronnen, waaronder DPG Media, Mediahuis, Erdee Mediagroep en De Groene Amsterdammer. Het persbureau ANP heeft zich ook bij het collectief aangesloten [2][3][4].

Impact op nieuwsproductie en -consumptie

De ontwikkeling van GPT-NL heeft een significante impact op de nieuwsproductie en -consumptie in Nederland. Door het model te trainen op rechtmatig verkregen, hoogwaardige data, wordt de integriteit van de journalistiek versterkt. Bovendien biedt het een verantwoord alternatief voor AI-toepassingen in de journalistiek, wat kan leiden tot meer nauwkeurige en betrouwbare nieuwsberichten [1][2][3].

Voordelen en nadelen

Het gebruik van GPT-NL in de journalistiek biedt zowel voordelen als nadelen. Een belangrijk voordeel is de verbeterde nauwkeurigheid en consistentie in nieuwsberichten, dankzij het gebruik van gecontroleerde en rechtmatig verkregen data. Daarnaast kan het model helpen bij het automatiseren van routineuze taken, zoals het genereren van samenvattingen en het detecteren van fouten [1][2][3]. Echter, er zijn ook ethische overwegingen. Het gebruik van AI in de journalistiek moet zorgvuldig worden toegespitst om de menselijke factor niet te vergeten en de kwaliteit en authenticiteit van het nieuws te behouden [5][6].

Ethische overwegingen

Een cruciale aspect van de ontwikkeling van GPT-NL is de aandacht voor ethische overwegingen. Het model wordt getraind op gecontroleerde, rechtmatig verkregen data, wat in lijn is met publieke waarden en auteursrecht. Dit is een belangrijk verschil met veel internationale modellen, die vaak op willekeurige kopieën van het internet worden getraind. Desalniettemin blijven er uitdagingen, zoals het beheren van gesloten datasets en het waarborgen van de privacy van datarechthebbenden [4][5][6].

Toekomstperspectieven

De training van GPT-NL begon in juni 2025 en wordt verder verbeterd voor het eerste gebruik in het vierde kwartaar van dit jaar. Het consortium dat GPT-NL ontwikkelt, werkt samen met het kabinet en NijBegun aan een Europese cofinancieringsaanvraag voor de bouw van een AI-fabriek in Groningen. Deze stap is een belangrijke mijlpaal in de ontwikkeling van verantwoorde AI-innovatie in Nederland [1][2][3].