Over de ALT-EDIC

De Alliantie voor Taaltechnologieën (ALT-EDIC) is een Consortium voor Europese digitale infrastructuur ondersteuning van de ontwikkeling van taaltechnologieën. Het bevordert excellentie in taaltechnologieën en draagt bij tot het behoud van de taalkundige diversiteit en culturele rijkdom van Europa.

Het werd in december 2023 door tien lidstaten voorgesteld en officieel opgericht door een Besluit van de Commissie in februari 2024. Het bestaat momenteel uit 27 leden en waarnemers. Het wordt gecoördineerd door Frankrijk en de statutaire zetel bevindt zich op de historische site van de Château de Villers-Cotterêts.

Een presentatie met een overzicht van de ALT-EDIC kan worden gedownload hier. 

Zicht vanuit de ruimte

De ALT-EDIC ondersteunt de ontwikkeling van taaltechnologieën

De Alliance for Language Technologies pakt de schaarste aan Europese taalgegevens aan die beschikbaar zijn voor de opleiding van grote taalmodellen (LLM's) en voor benchmarking voor dergelijke modellen.

Dit zal leiden tot betere oplossingen op het gebied van artificiële intelligentie (AI) die taal kunnen begrijpen en genereren, rekening houdend met de taalkundige diversiteit en culturele rijkdom van Europa.

De missie van ALT-EDIC is gericht op de volgende vijf acties:

Actie 1 – Gegevens

ALT-EDIC zal gebruik maken van de Language Data Space en bestaande taal- en multimodale middelen van de EU en de lidstaten bundelen in alle Europese, nationale en regionale talen, onder meer door het creëren van strategische gegevens, zoals voor talen met weinig sprekers (minder dan 10 miljoen sprekers) waarin er inherente beperkingen zijn aan de opleiding van grote taalmodellen (LLM's).

Actie 2 ? Bestaande modellen

ALT-EDIC zal een register creëren van bestaande open-source taalmodellen voor hergebruik door industriële actoren en specifieke methoden ontwikkelen voor fine-tuning, met name voor kmo's, en zal evaluatie-, certificerings- en normalisatiemethodologieën aanbieden met bijzondere aandacht voor mogelijke discriminatie en vooroordelen die worden geïntroduceerd door modellen voor natuurlijke taalverwerking (NLP).

Actie 3 ? Ontwikkeling van modellen

ALT-EDIC zal fungeren als een "pool seed"-fonds, dat publieke en private middelen samenbrengt om nieuwe projecten voor grote taalmodellen en stichtingsmodellen met multimodale capaciteiten te lanceren en te ontwikkelen, onder meer door toegang te verlenen tot de nodige Europese high-performance computing.

Actie 4 ? Evaluatie, certificering en normalisatie

ALT-EDIC zal bijdragen tot de ontwikkeling van evaluatiemethodologieën, met bijzondere aandacht voor mogelijke discriminatie en vooringenomenheid die door NLP-modellen worden geïntroduceerd, alsook voor het verlenen van specifieke steun aan instellingen voor investeringen in langetermijninvesteringen.

Actie 5 – Ecosysteem

ALT-EDIC zal fungeren als adviespunt voor overheidsdiensten en het publiek bereiken via een cultureel programma op basis van artificiële intelligentie voor talen en LT-eindgebruikers, die ook gegevensproducenten zijn, in staat stellen de uitdagingen van artificiële intelligentie en taaltechnologieën in een meertalige context aan te gaan en bij te dragen tot de verlichting van de Europese burger op het gebied van artificiële intelligentie.