Par ALT-EDIC

Valodu tehnoloģiju alianse (ALT-EDIC) ir Eiropas Digitālās infrastruktūras konsorcijs atbalsts valodu tehnoloģiju attīstībai. Tā veicina valodu tehnoloģiju izcilību un palīdz saglabāt Eiropas valodu daudzveidību un kultūras bagātību.

To 2023. gada decembrī ierosināja 10 dalībvalstis, un to oficiāli izveidoja Komisijas lēmums 2024. gada februārī. Pašlaik tajā ir 27 locekļi un novērotāji. To koordinē Francija, un tiesību aktos noteiktā mītne atrodas vēsturiskajā vietā, kurā atrodas Château de Villers-Cotterêts.

Prezentāciju, kurā sniegts pārskats par ALT-EDIC, var lejupielādēt šeit. 

Skats no kosmosa

ALT-EDIC atbalsta valodu tehnoloģiju izstrādi

Valodu tehnoloģiju alianse pievēršas tam, ka trūkst Eiropas valodu datu, kas pieejami lielu valodu modeļu (LM) apmācībai un šādu modeļu salīdzinošai novērtēšanai.

Tā rezultātā tiks uzlaboti mākslīgā intelekta (MI) risinājumi, kas spēj izprast un radīt valodu, ņemot vērā Eiropas valodu daudzveidību un kultūras bagātību.

ALT-EDIC misija ir vērsta uz šādām piecām darbībām:

Darbība. Dati

Alt-EDIC izmantos valodu datu telpu un atbalstīs pastāvošo valodu un multimodālos resursus no ES un dalībvalstīm visās Eiropas, valstu un reģionālajās valodās, tostarp izstrādājot stratēģiskus datus, piemēram, attiecībā uz valodām ar nedaudziem runātājiem (mazāk nekā 10 miljoniem runātāju), kurās pastāv ierobežojumi lielu valodu modeļu (LLM) apmācībai.

Darbība? Esošie modeļi

Alt-EDIC izveidos esošo atklātā pirmkoda valodu modeļu repozitoriju, ko rūpniecības dalībnieki izmanto atkārtotai izmantošanai, un izstrādās īpašas metodes precizēšanai, jo īpaši attiecībā uz MVU, un nodrošinās novērtēšanas, sertifikācijas un normalizēšanas metodes, īpašu uzmanību pievēršot iespējamai diskriminācijai un aizspriedumiem, kas ieviesti ar dabiskās valodas apstrādes (NLP) modeļiem.

Darbība Nr. 3? Modeļu izstrāde

Alt-EDIC darbosies kā rezerves sagatavošanas fonds, apvienojot publiskos un privātos resursus, lai uzsāktu un attīstītu jaunus liela apjoma valodu modeļa projektus un fonda modeļus ar multimodālām spējām, tostarp nodrošinot piekļuvi nepieciešamajai Eiropas augstas veiktspējas datošanai.

4. darbība? Izvērtēšana, sertifikācija un normalizācija

Alt-EDIC veicinās novērtēšanas metožu izstrādi, īpašu uzmanību pievēršot iespējamai diskriminācijai un neobjektivitātei, ko ievieš NLP modeļi, kā arī tam, lai sniegtu īpašu atbalstu iestādēm ieguldījumiem LT.

Darbība. Ekosistēma

Alt-EDIC darbosies kā padomdevējs valsts pārvaldes iestādēm, kā arī sabiedrības uzrunāšanai, izmantojot kultūras programmu, kuras pamatā ir mākslīgais intelekts valodām un kura ļauj LT galalietotājiem, kas ir arī datu sagatavotāji, daudzvalodības kontekstā stāties pretī mākslīgā intelekta un valodu tehnoloģiju izaicinājumiem un veicināt Eiropas iedzīvotāju izpratni mākslīgā intelekta jomā.