30 Mar Storia della Machine Translation
La traduzione automatica (Machine Translation) fa riferimento alla traduzione effettuata da un software, o da un portale, in grado di tradurre testi da una lingua a un’altra anche senza l’intervento dell’essere umano.
1) I primi anni nella storia della Machine Translation
2) Dal rapporto ALPAC agli anni novanta
3) Gli anni Duemila
Sembra che la storia della Machine Translation si possa far risalire al lontano 800 AD. Il crittografo arabo Al-Kindi si dedicò per primo allo sviluppo di rudimentali tecniche di traduzione linguistica. Queste sono utilizzate in parte ancora oggi nei processi di traduzione automatica.
Il concetto vero e proprio di Traduzione Automatica si sviluppò però in modo più concreto intorno agli anni ‘30. In questo periodo, il franco-armeno Georges Artsrouni e l’ingegnere russo Peter Troyanskij presentarono due innovative proposte riguardanti i primi brevetti per macchine traduttrici. Il loro funzionamento si basava su tre fasi:
- nella prima l’editor organizzava le parole della lingua di partenza per gestirne la forma logica
- la macchina poi traduceva il testo nella lingua di destinazione
- infine l’editor ne sistemava per l’ultima volta l’output finale
I primi anni nella storia della Machine Translation
Le due proposte rimasero pressoché sconosciute fino agli anni ‘50, quando il matematico e ricercatore della Fondazione Rockefeller, Warren Weaver, sviluppò quello che viene oggi considerato il primo documento a tema Traduzione Automatica su computer: the Translation Memorandum. Le proposte di Weaver contribuirono a definire il ruolo del computer nella traduzione e diedero un forte impulso alla ricerca nel settore.
Qualche anno più tardi, nel gennaio del 1954, si tenne nella sede newyorkese di IBM un evento che scatenò l’interesse del pubblico: si trattava dell’esperimento Georgetown, la prima dimostrazione pubblica di un sistema di Machine Translation. Nel corso dell’esperimento furono tradotte 49 frasi dal russo all’inglese con un sistema capace di elaborare 250 termini di vocabolario. Il sistema presentava indubbiamente notevoli limitazioni dal punto di vista quantitativo, ma contribuì a stimolare l’interesse del pubblico e la ricerca nel campo della traduzione automatica a livello globale.
Nello stesso periodo, nacquero i primi sistemi operativi, che resero possibile migliorare il sistema di traduzione in termini di velocità. Ma al tempo stesso, emersero anche i principali limiti della traduzione automatica. Il matematico Yehoshua Bar-Hillel, affermò che sarebbe stato possibile ottenere una traduzione interamente automatizzata, solo facendo i conti con un basso livello di qualità del risultato finale.
Inoltre, riteneva che l’ambiguità semantica e la complessità della sintassi fossero i due principali ostacoli allo sviluppo di una Fully Automatic High Quality Translation. Il matematico si impegnò così ad elaborare un nuovo modello di traduttore automatico di qualità superiore.
Dal rapporto ALPAC agli anni Novanta
Nel decennio successivo, la ricerca proseguì, concentrandosi in particolare sul rapporto traduzione inglese-russo e sulla traduzione di documenti tecnico-scientifici. Nel 1966 si registrò però un punto di svolta con il rapporto ALPAC, commissionato dagli USA e consegnato dall’Automatic Language Processing Advisory Committee. Il rapporto rallentò l’entusiasmo relativo alla ricerca nel campo e mise in luce i limiti della traduzione automatica.
In particolare, evidenziò il mancato raggiungimento di progressi e le marcate differenze rispetto alla traduzione umana. Per una decina d’anni la ricerca americana subì un forte rallentamento, fatta eccezione per alcuni progetti di traduzione sviluppati sul territorio americano. Nel 1977, per esempio, installato in Canada il sistema METEO, usato per tradurre le previsioni meteo dall’inglese al francese.
Il fenomeno della globalizzazione, che si consolidò a partire dagli anni ‘70, contribuì ad aumentare anche la richiesta di sistemi a basso costo per la traduzione di documenti tecnici, da parte di Canada, Giappone ed Europa. Per tutto il decennio successivo, diverse aziende approfittarono della disponibilità dei sistemi di traduzione automatica di tipo mainframe, particolarmente diffusi al tempo.
Negli anni ‘80 la ricerca del settore si concentrò invece sulla traduzione tramite rappresentazioni linguistiche intermedie, che coinvolgono analisi morfologiche, sintattiche e semantiche. Nello stesso periodo subentrarono anche nuovi processi legati al settore della traduzione automatica e IBM sviluppò nuovi metodi di traduzione di carattere statistico.
Negli anni ‘90 la ricerca si spostò invece sulla traduzione dedicata alla sintesi vocale e aumentò, più in generale, l’utilizzo della traduzione automatica grazie all’avvento di personal comupter potenti a basso costo.
Gli anni Duemila
Nel 2003 Franz-Josef Och vinse una gara di velocità di traduzione automatica e si ritrovò in poco tempo al vertice del Dipartimento di Traduzione di Google. Circa nove anni dopo, Google annunciava che il suo “Translate” capace di tradurre una quantità di testo sufficiente a riempire un milione di libri al giorno. l’interpretazione automatica combina tre tecnologie di IA: i software di riconoscimento vocale, i software di sintesi vocale e la traduzione automatica.
L‘uso commerciale della machine translation diventò però rilevante solo nel nuovo millennio. Dal 2017, con l’introduzione sul mercato dei primi sistemi basati su intelligenza artificiale e Deep Learning, la traduzione automatica conobbe una vera e propria esplosione. I sistemi di traduzione automatica basata su regole (RBMT) furono i primi sistemi commerciali basati su regole linguistiche. Questa tipologia di traduzione fa infatti affidamento su un numero elevato di regole linguistiche incorporate e su altrettanti dizionari bilingue per ogni combinazione linguistica.
Sebbene la qualità di traduzione raggiunta dai sistemi di Machine Translation Neurale sia oggi incredibilmente elevata, l’intervento umano resta sempre necessario. I processi di traduzione automatica terminano infatti con la fase di Post-Editing di Machine Translation (MTPE), che consiste nella revisione, da parte di un linguista professionista, delle traduzioni effettuate da un motore di Machine Translation.