Sono tre i principali modelli di sistemi di traduzione automatica (Machine Translation):
- sistemi basati su regole
- sistemi statistici
- sistemi ibridi
I sistemi basati su regole, per esempio Systran ai tempi di Altavista Babel Fish, si basano su un numero elevato di regole linguistiche organizzate in moduli diversi che interagiscono a diversi livelli e su milioni di dizionari bilingui per ogni combinazione linguistica. La MT basata su regole fornisce una buona qualità nelle situazioni generiche (cioè, non specifiche di un dominio) ed è per sua natura prevedibile.
Nei sistemi statistici, come Google traduttore, si fa ricorso a parametri statistiche che derivano dall’analisi di corpora monolingui o bilingui per l’attribuzione dell’ordine delle parole e del migliore candidato per la traduzione. Non vengono utilizzate regole grammaticali, ma si usano le probabilità di occorrenza e di frequenza delle parole. La creazione dei modelli di traduzione statistica è un processo rapido, ma la tecnologia fornisce una buona qualità solo se sono disponibili corpora estesi e qualificati. La traduzione è fluida, e i risultati dei sistemi di impronta statistica risultano nel complesso migliori rispetto a quelli che fanno ricorso a regole.
I più recenti sistemi di MT sono spesso ibridi (per esempio l’attuale Systran o Bing Translator), e combinano le metodologie basate su regole con quelle statistiche con lo scopo di sviluppare diverse strategie di risoluzione a seconda dello specifico problema traduttivo da affrontare.
Leggi anche: Different Approaches to Machine Translation. A brief history of the development
of language technologies di Jaap Van Der Meer
The comment is very interesting for translators.