Itzulpen automatiko neuronal koherenterako metodoak eta sistemak

TANDO

Itzulpen automatiko neuronal koherenterako metodoak eta sistemak

Iraupena:

01.04.2020 - 31.12.2021

Teknologiak:

Language Processing

Lotutako soluzioak:

Hizkuntza eta ahots teknologiak

Tando ikerketa-proiektu bat da, eta bere helburu nagusia testuinguru jakin batean koherentea den itzulpen automatiko neuronaleko sistemak ikertzea, garatzea eta baliozkotzea da.

Itzulpen automatikoak arrakasta garrantzitsuak lortu ditu azken urteotan, eta itzulpenen kalitatea nabarmen handitzea lortu du, sare neuronal artifizialetan oinarritutako sistemen eta ikaskuntza sakonaren bidez. Aurrerapen horiek gorabehera, gaur egungo sistemak esaldi-mailako itzulpen automatikoko prozesuetan oinarritzen dira, hau da, esaldi bakoitza modu independentean itzultzen da, esaldiak agertzen diren testuinguru globalera iritsi gabe. Muga hori akats sistematikoetan datza, ezin baita esaldien testuingururako sarbidea eskatzen duen hizkuntza-fenomenorik moldatu.

Testuinguruaren koherentzia faltaren ondorioz itzulpen-akatsak murrizteko metodo optimoak lantzea da proiektuaren ardatza, itzulpenen kalitatea areagotuz testuinguruaren irudikapenen bidez eta itzulpen automatiko neuronalaren prozesuen egokitzapenen bidez. Horretarako, proiektuak honako alderdi nagusi hauek biltzen ditu:

• Itzulpen neuronaleko arkitekturak eta algoritmoak ikertu eta garatzea, itzulpenaren koherentzia eta kalitate globala nabarmen hobetzeko.

• Itzulpen automatiko neuronaleko sistema aurreratuak sortzea, kalitate handikoak, testuinguruko informazioaren prozesamendua barne hartzen dutenak.

• Euskara-gaztelania eta euskara-frantsesa itzulpen generiko koherentea garatzeko eta baliozkotzeko datu-multzoak sortzea eta prestatzea.

• Garatutako sistemen ebaluazio automatikoa eta giza ebaluazioa.

Tando Eusko Jaurlaritzak eta EGEF funtsek SPRIren Elkartek 2020 laguntzen deialdiaren bidez diruz lagundutako proiektua da. Honako partzuergo honek egiten du: Ametzagaña (koordinatzailea), Vicomtech (koordinazio zientifikoa), Euskal Herriko Unibertsitateko (EHU) IXA taldea, Elhuyar eta Isea.

Koordinazio zientifikoaz gain, Vicomtech-ek itzulpen automatiko neuronalean testuinguruaren koherentziaren tratamendua hobetzeko metodoen ikerketarekin, garapenarekin eta ebaluazioarekin lotutako alderdi guztietan laguntzen du. Horretarako, Vicomtech-ek testuinguru-informazioaren modelatze neuronalean oinarritutako metodo aurreratuen diseinuan eta integrazioan parte hartzen du, bai eta testuinguru-mailan koherenteak diren itzulpen neuronal automatikoko ereduak entrenatzeko eta baliozkotzeko baliabide egokiak prestatzen ere. TANDOAREN esparruan aztertzen diren metodoek ikuspegi nagusiak estaltzen dituzte, hala nola eredu neuronalen entrenamenduko testuinguruaren hedapena, testuinguruaren kudeaketara bideratutako kodegailuen erabilera edo testuingurua zuzentzera bideratutako metodoak. Jarduera horiei esker, batetik, itzulpen automatikoko artearen egoera hobetu ahal izango da, eta, bestetik, ingurune errealetan erabiltzeko testuinguru-itzulpeneko metodoen eraginkortasuna zehaztu ahal izango da, itzulpen automatikoko egungo sistemen kalitatea eta erabilgarritasuna handitzeko helburuarekin.

Jar zaitez gurekin harremanetan:

Vicomtech

Gipuzkoako Zientzia eta Teknologia Parkea,
Mikeletegi Pasealekua 57,
20009 Donostia / San Sebastián (Espainia)

+(34) 943 309 230

close overlay