Hizkuntza Datuak Optimizatzeko Tresna.

LIDO

Iraupena:

01.04.2022 - 31.12.2024

Teknologiak:

Language Processing

Itzulpen-prozesuak ezinbestekoak dira jarduera sozioekonomikoak nabarmen zailtzen dituzten hizkuntza-oztopoak konpontzeko, bereziki Europar Batasuna edo Euskal Autonomia Erkidegoa bezalako komunitate eleanitzetan. Egungo mundu digitalean sortutako edukien hazkunde esponentzialaren aurrean, itzulpen-jarduerek gero eta gehiago oinarritu behar dute eskainitako teknologietan, hala nola itzulpengintzari laguntzeko tresnetan (CAT), itzulpen-memorietan (TM) oinarrituta, eta itzulpen automatikoan (TA). TAren esparruan aurrerapen esanguratsuak lortu dira azken urteetan, sare neuronal artifizialetan eta ikaskuntza sakonean oinarritutako Adimen Artifizialean (AA) egindako aurrerapenen ondorioz (Deep Learning). Itzulpen automatiko neuronala (TAN) paradigma zientifiko eta komertzial berri gisa nagusitu da, eta gero eta integratuago dago eduki eleanitzak sortzeko prozesuetan, bereziki TA edukitzearen bidezko itzulpen profesionalen ekoizpenean. Kalitate handiko itzulpen automatikoak eskaintzeko, TANk datu linguistiko paraleloen multzo zabalak behar ditu, hau da, bi hizkuntzatan lerrokatutako esaldi itzulien multzoak, hizkuntza pareen arteko itzulpen ezagutza modelatzeko. Baliabide horiek kalitate handikoak izan behar dute, datu zaratatsuekin entrenatutako TANaren kalitateari nabarmen eragiten diotelako, hala nola lerrokatze okerrak, karaktere ustelak edo kodetze okerra, besteak beste. Era berean, itzulpen-memorietako akatsak giza itzultzaileentzako produktibitate-maila txikikoak dira. Praktikan, hizkuntza-corpusetan eta itzulpen-memorietan zarata esanguratsua egotea orokorra da, eta nabarmen kaltetzen ditu itzulpen-prozesuen eraginkortasuna eta kalitatea. LIDO proiektuaren helburu nagusia da hizkuntza datu eleanitzak adimen artifizialeko teknologien bidez optimizatzeko sistema bat ikertzea eta garatzea. Optimizazioa hiru ardatz nagusitan landuko da, hizkuntza neuronaleko ereduak, irudikapen semantiko bektorial eleaniztuneko ereduak eta eramangarritasun handiko eredu estatistikoak barne hartuko dituzten AA eredu dedikatuak ustiatuz.

Zure hurrengo proiekturako kide bila zabiltza? Idatz iezaguzu, laguntzeko irrikan gaude.

Vicomtech

Gipuzkoako Zientzia eta Teknologia Parkea,
Mikeletegi Pasealekua 57,
20009 Donostia / San Sebastián (Espainia)

+(34) 943 309 230

Zorrotzaurreko Erribera 2, Deusto,
48014 Bilbo (Espainia)

close overlay

Jokaeraren araberako publizitateko cookieak beharrezkoak dira eduki hau kargatzeko

Onartu jokaeraren araberako publizitateko cookieak