Ikus-entzunezko hizkuntza-baliabideak partekatzea azpitituluen sorrera automatikoetarako
Savas
Iraupena:
01.05.2012 - 30.04.2014
Duela gutxi onartutako zenbait zuzentarau eta lege europar eta nazional direla medio, azpitituluen eskaera azkar hazi da azken urteotan. Eskuzko azpitituluak ez dira bideragarriak, eskaera handia delako eta prozesua garestia, denborari eta langileei dagokienez. Ondorioz, igorleek eta azpititulu-konpainiek eskuzko prozesuak baino produktiboagoak diren aukera berriak bilatzen ari dira. Hiztegi handiko hizketa-ezagutze iraunkorra teknologia oso erabilgarria da horretarako. Denbora errealeko azpitituluak (Re-speaking) deritzon teknikan, profesional batek jatorrizko audioa entzuten du eta hizketa-ezagutzeko makina batean errepikatu, makinak idazteko. Zuzeneko igorpenetan eta grabazioetan azpitituluak jartzeko teknikarik erabiliena bihurtzen ari da. Beste joera bat da hizketa-ezagutza erabiltzea programaren soinu-bandaren transkripzio automatikoa sortzeko, pertsonarik behar gabe. Transkripzio hori, gero, azpitituluak egiteko oinarritzat erabiltzen da.
Zoritxarrez, denbora errealeko azpitituluetarako eta/edo azpiidatzi automatikoetarako hiztegi handiko hizketa-ezagutze iraunkorrak elikatzeko, hizketa eta testu-corpusak bildu eta jaso behar dira. Horrek kostu handia dauka, eta, ondorioz, hizkuntza eta aplikazio-domeinu berrien garapena moteldu da. Hala ere, ikus-entzunezkoen gaineko legeak betetzeko, europar igorleek eta azpititulu-konpainiek hiztegi handiko hizketa-ezagutze iraunkorrerako hizketa- eta testu-corpusak sortzen dituzte etengabean. SAVAS proiektuaren xedea da igorleen eta azpititulu-konpainien ikus-entzunezko baliabideak lortzea, partekatzea eta berrerabiltzea hizketa-ezagutza automatikoan diharduten Europako konpainiek datu partekatuak erabili ditzaten hiztegi handiko hizketa-ezagutze iraunkorrak sortzeko, domeinu zehatzetarako eta/edo hizkuntza berrietarako, komunikabideen azpititulu-beharrei erantzuteko helburuarekin. Proiektu barruan, azpitituluak automatikoki sortzeko datuak eta hiztegi handiko hizketa-ezagutze iraunkorreko teknologiak bildu, partekatu eta garatuko ditugu, sei hizkuntza hauetan: euskara, gaztelania, italiera, frantsesa, alemana eta portugesa.
Zure hurrengo proiekturako kide bila zabiltza? Idatz iezaguzu, laguntzeko irrikan gaude.