Om ALT-EDIC

Alliancen for Sprogteknologier (ALT-EDIC) er en Konsortiet for en europæisk digital infrastruktur støtte til udvikling af sprogteknologier. Det fremmer topkvalitet inden for sprogteknologier og bidrager til bevarelsen af Europas sproglige mangfoldighed og kulturelle rigdom.

Det blev foreslået af 10 medlemsstater i december 2023 og officielt oprettet af en Kommissionens afgørelse i februar 2024. Der er i øjeblikket 27 medlemmer og observatører. Det koordineres af Frankrig, og dets vedtægtsmæssige hjemsted er beliggende i det historiske sted for Château de Villers-Cotterêts.

En præsentation med en oversigt over ALT-EDIC kan downloades her. 

Udsigt fra rummet

ALT-EDIC støtter udviklingen af sprogteknologier

Alliancen for sprogteknologier tager fat på manglen på europæiske sprogdata, der er tilgængelige for uddannelse af store sprogmodeller (LLM'er), og på benchmarking for sådanne modeller.

Dette vil føre til forbedrede løsninger inden for kunstig intelligens (AI), der er i stand til at forstå og generere sprog under hensyntagen til Europas sproglige mangfoldighed og kulturelle rigdom.

ALT-EDIC's mission fokuserer på følgende fem aktioner:

Foranstaltning 1 – Data

ALT-EDIC vil udnytte sprogdataområdet og samle eksisterende sprogressourcer og multimodale ressourcer fra EU og medlemsstaterne på alle europæiske, nationale og regionale sprog, herunder gennem oprettelse af strategiske data, f.eks. for sprog med få talere (mindre end 10 mio. talere), hvor der er iboende begrænsninger for uddannelse i store sprogmodeller.

Aktion 2 ? Eksisterende modeller

ALT-EDIC vil oprette et register over eksisterende open source-sprogmodeller, der kan genbruges af industrielle aktører, udvikle specifikke metoder til finjustering, navnlig for SMV'er, og stille evaluerings-, certificerings- og normaliseringsmetoder til rådighed med særligt fokus på potentiel forskelsbehandling og bias indført ved modeller for behandling af naturligt sprog (NLP).

Aktion 3 ? Udvikling af modeller

ALT-EDIC vil fungere som en puljefond, der samler offentlige og private ressourcer med henblik på at lancere og udvikle nye projekter vedrørende store sprogmodeller og fondsmodeller med multimodale kapaciteter, herunder ved at give adgang til den nødvendige europæiske højtydende databehandling.

Aktion 4 ? Evaluering, certificering og normalisering

ALT-EDIC vil bidrage til udviklingen af evalueringsmetoder med særligt fokus på potentiel forskelsbehandling og bias, der indføres med NLP-modeller, samt til at yde målrettet støtte til institutioner til investering i langsigtede investeringer.

Foranstaltning 5 – Økosystem

ALT-EDIC vil fungere som et rådgivningspunkt for offentlige forvaltninger og nå ud til offentligheden gennem et kulturprogram baseret på kunstig intelligens for sprog og gøre det muligt for slutbrugere af sprogteknologi, som også er dataproducenter, at tage udfordringerne i forbindelse med kunstig intelligens og sprogteknologier op i en flersproget sammenhæng og bidrage til at oplyse de europæiske borgere om kunstig intelligens.