AIJB

Les éditeurs de presse néerlandais collaborent sur un modèle de langage IA responsable GPT-NL

Les éditeurs de presse néerlandais collaborent sur un modèle de langage IA responsable GPT-NL
2025-07-18 journalistiek

den haag, vrijdag, 18 juli 2025.
Les éditeurs de presse néerlandais ont fourni une vaste collection d’articles de presse pour l’entraînement du modèle de langage IA GPT-NL. Cette initiative, une collaboration entre TNO, NDP Nieuwsmedia et d’autres institutions, vise à offrir une alternative responsable et légale aux modèles IA existants. La base de données contient plus de 20 milliards de tokens et contribuera à renforcer la position du journalisme aux Pays-Bas tout en respectant la législation européenne. L’entraînement de GPT-NL a commencé en juin 2025 et sera amélioré pour une première utilisation au quatrième trimestre de cette année.

Une alternative responsable

GPT-NL est une initiative des organisations à but non lucratif TNO, NFI et SURF, développée pour les Pays-Bas avec des données néerlandaises de haute qualité. Le modèle respecte la législation européenne, comme le Règlement sur l’IA, et rémunère les éditeurs pour l’utilisation de leur contenu. Cela contraste fortement avec de nombreux modèles internationaux de Big Tech, qui sont souvent entraînés sur des articles de presse sans autorisation ni compensation [1][2][3].

Collaboration et données

Les éditeurs de presse néerlandais, représentés par NDP Nieuwsmedia, ont fourni une grande collection d’articles de presse pour l’entraînement de GPT-NL. Cette base de données comprend plus de 20 milliards de tokens, provenant de plus de 30 sources nationales et régionales, dont DPG Media, Mediahuis, Erdee Mediagroep et De Groene Amsterdammer. L’agence de presse ANP s’est également jointe au collectif [2][3][4].

Impact sur la production et la consommation de news

Le développement de GPT-NL a un impact significatif sur la production et la consommation de news aux Pays-Bas. En formant le modèle sur des données de haute qualité obtenues légalement, l’intégrité du journalisme est renforcée. De plus, il offre une alternative responsable aux applications d’IA dans le journalisme, ce qui peut conduire à des nouvelles plus précises et fiables [1][2][3].

Avantages et inconvénients

L’utilisation de GPT-NL dans le journalisme présente à la fois des avantages et des inconvénients. Un avantage majeur est l’amélioration de la précision et de la cohérence des nouvelles, grâce à l’utilisation de données contrôlées et obtenues légalement. De plus, le modèle peut aider à automatiser les tâches routinières, telles que la génération de résumés et la détection d’erreurs [1][2][3]. Cependant, il y a aussi des considérations éthiques. L’utilisation de l’IA dans le journalisme doit être soigneusement examinée afin de ne pas oublier le facteur humain et de préserver la qualité et l’authenticité des nouvelles [5][6].

Considérations éthiques

Un aspect crucial du développement de GPT-NL est l’attention portée aux considérations éthiques. Le modèle est formé sur des données contrôlées et obtenues légalement, ce qui est conforme aux valeurs publiques et au droit d’auteur. C’est une différence importante par rapport à de nombreux modèles internationaux, qui sont souvent formés sur des copies arbitraires d’Internet. Néanmoins, il reste des défis, tels que la gestion de bases de données fermées et la garantie de la confidentialité des titulaires de données [4][5][6].

Perspectives futures

L’entraînement de GPT-NL a commencé en juin 2025 et sera amélioré pour une première utilisation au quatrième trimestre de cette année. Le consortium qui développe GPT-NL travaille en collaboration avec le gouvernement et NijBegun sur une demande de cofinancement européen pour la construction d’une usine d’IA à Groningue. Cette étape est une étape importante dans le développement de l’innovation IA responsable aux Pays-Bas [1][2][3].

Sources