10*

Mi spieghi tutto come se avessi due anni.
Joe Miller in Philadelphia

Il modo migliore per comprendere poteri e limiti di una tecnologia è di usarla.

La cosa è semplice per le tecnologie di applicazione generale, e anche la traduzione automatica ormai si può considerare tale. Infatti, il risultato più importante che si può riconoscere a Google Translate è di aver reso popolare la traduzione attraverso la traduzione automatica, cosa che celebrati studiosi e influenti organismi professionali non hanno ottenuto in anni e anni di sforzi.

La questione irrisolta della valutazione della qualità è emblematica dell’intera comunità della traduzione.

Se ne discute da secoli, per lo più tra addetti ai lavori, sempre gli stessi, nelle solite sedi. E coloro che intervengono in certi dibattiti non parlare con quelli che intervengono in altri.

Il risultato è un approccio mal concepito alla valutazione della qualità che miete ancora vittime, anche tra gli scienziati che lavorano sui metodi di valutazione automatica, tra i quali, proprio di recente, è riemersa la tipica assurdità della “traduzione perfetta”, quando chiunque sia, anche solo fugacemente, toccato dalla traduzione sa che niente si più facilmente dimostrare fallato di una “traduzione perfetta”. Almeno stando ai modelli di valutazione correnti, secondo un tipico bias di conferma.

Sull’orlo del definitivo sgretolamento, è ancora l’ortodossia a dominare la traduzione, perfino in ambito tecnologico, sradicando il principio chiave dell’innovazione, la semplicità.

Alla crescita del volume di contenuti, prevista e tuttavia ancora pressante, si associa una continua richiesta di traduzioni, sempre più rapide e in un numero sempre maggiore di lingue, e la traduzione automatica è sempre più spesso prospettata come l’unica soluzione praticabile.

Resta irrisolto, però, il problema di offrire ai clienti un modo semplice per sapere se il gioco vale la candela. Ciò che, invece, l’intero settore è stato in grado di offrire finora, soprattutto ai clienti più sprovveduti è stato un dedalo di categorie e tipologie di errore, di pesi e parametri, in cui si può perdere con facilità anche il più esperto linguista.

La pretesa, ancora diffusissima, di “educare il cliente” è la manifestazione concreta della tipica asimmetria informativa che pervade e affligge il settore. Accademici, esperti e operatori cullano tutti la futile illusione di poter guadagnare rispetto e considerazione per il proprio ruoli giocando sull’ignoranza dei clienti, mentre non fanno che darsi la zappa sui piedi.

Quando Poulomi Choudhury di KantanMT sottolinea il ruolo e l’importanza delle metriche multidimensionali per la qualità (le MQM), con tutta probabilità si rivolge ai colleghi linguisti, perché il cliente tipico vuole semplicemente sapere se e magari quanto dovrà ancora spendere per la sua traduzione. I clienti più sprovveduti, in particolare, non sono interessati ai KPI proposti da Poulomi Choudhury, mentre potrebbero trovarne più interessanti altri che permettano loro di valutare l’affidabilità di un potenziale fornitore.

Forse, la perversa complessità di metriche per la valutazione della qualità della traduzione così intricate serve a nascondere l’incertezza e ambiguità di certe teorie e la loro inadeguatezza, piuttosto che a rassicurare i clienti e a fornire loro strumenti che possano utilizzare.

Peraltro, ogni volta che qualcuno prova metta in discussione il meccanismo arrugginito e difettoso alla base di queste metriche, la comunità accademica si chiude a riccio.

Nel suo post, Poulomi Choudhury suggerisce di definire parametri esatti per i revisori. Peccato che la nascita delle innumerevoli dispute tra traduttori e revisori, traduttori, revisori e terminologi, utenti, e tra traduttori, revisori, terminologi, esperti e utenti si perda nella notte dei tempi.

Non solo le istruzioni per revisione e post-editing (PEMT) sono merce rara, gli stessi esperti di traduzione che instancabilmente inondano il settore con standard inutili e metriche intricate, senza magari aver mai trascorso un’ora della loro vita a negoziare con i clienti, non hanno prodotto fin qui neanche uno straccio di schema che aiuti gli operatori a sviluppare questi documenti.

Come implementare una piattaforma per la traduzione automatica non è uno scherzo, e non ci si può improvvisare esperti, la redazione di istruzioni per il PEMT non è una passeggiata di salute, richiedendo competenze specifiche che giustificano il ricorso a un consulente.

Per esempio, sebbene la loro redazione sia un’attività una tantum, motori diversi, domini diversi e coppie linguistiche diverse richiedono istruzioni diverse che variano a seconda dell’impegno richiesto. Una volta pronte, poi, queste istruzioni vanno aggiornate man mano che si implementano nuovi motori, coppie linguistiche e domini. Inoltre, per aiutare i project manager a valutare l’impegno richiesto, queste istruzioni devono affrontare anche la questione qualità con indicazioni precise, soglie e punteggi per il prodotto grezzo. E devono, ovviamente, essere chiare e concise, il che costituisce la vera difficoltà.

Oltre a essere correlato alla qualità del prodotto grezzo, l’impegno richiesto per il PEMT dovrebbe essere indicato con una misura facilmente comprensibile che permetta al cliente di calcolare anche la spesa da sostenere. Questa misura dovrebbe quindi essere esaurientemente definita e offerta insieme a strumenti che aiutino il cliente a stimare finanziariamente la quantità di lavoro necessaria per ottenere la qualità desiderata a partire da una traduzione automatica.

Infatti, l’impegno richiesto per il PEMT dipende da diversi fattori quali volume, tempo di consegna finale e qualità attesa per il prodotto finito. Essenzialmente, però, dipende dalla traducibilità del contenuto originale.

Di conseguenza, per quanto le misure automatiche aiutino, l’impegno richiesto per il PEMT si può solo stimare a grandi linee. In quest’ottica, gli strumenti offerti da KantanMT permettono di ottenere stime estremamente accurate.

D’altra parte, misurare il PEMT a posteriori confrontando risultato finale e traduzione grezza iniziale è coerente con l’attuale, tradizionale, modello di valutazione della qualità, ma non soddisfa le esigenze del cliente solitamente volte a modelli predittivi.

Inoltre, la retribuzione basata su un modello a posteriori richiede una misurazione accurata del lavoro effettivamente svolto per poter stimare la percentuale di onorario in base alla distanza di edit, giacché non esiste prova di correlazione tra distanza di edit e produttività.

Tuttavia, anche la rilevazione del lavoro effettivamente svolto può tornare utile se si confrontano i dati raccolti con le stime e se ne ricava una serie storica. Dopo tutto, è a questo che servono i dati.

La prevedibilità è importante in qualsiasi attività, e non dovrebbe stupire che i clienti non vogliano perdersi nel meandri di metriche irrimediabilmente prone a soggettività, ambiguità e interpretazioni erronee e, quel che più conta, del tutto irrilevanti. Quando si tratta di affari, e di soldi veri, l’azzardo non è mai un’opzione, semmai è l’ultima spiaggia.

D’altra parte, è passato più di un quarto di secolo dall’introduzione degli strumenti CAT in campo professionale, e molti libri e articoli sono stati scritti al riguardo, eppure sono ancora tanti quelli che avvertono ancora il bisogno di spiegare cosa sono. Magari potrebbe ancora avere senso per quei pochi clienti del tutto all’oscuro, anche se probabilmente potrebbero essere più interessati a sapere che i loro fornitori utilizzano qualche strumento che permetta loro di risparmiare qualcosa. In ogni caso, la qualità resterebbe comunque motivo di preoccupazione, come è emerso anche da una ricerca di SDL.

Un’introduzione agli strumenti di CAT, però, è a dir poco curiosa se i destinatari sono traduttori professionisti o studenti di traduzione prossimi alla laurea. Anche sfatare alcuni miti ancora popolari sugli strumenti CAT è quanto meno curioso, a meno di voler contrastare i numerosi predicatori che tuonano dai loro pulpiti virtuali contro i pericoli di questi strumenti del diavolo.

In questo scenario apocalittico, anche un significativo balzo in avanti passa quasi inosservato. Lilt è uno strumento di traduzione innovativo, con alcune caratteristiche favolose, soprattutto per i traduttori professionisti. Come dice Kirti Vashee, è un assistente virtuale del traduttore. Certo presenta anche alcuni svantaggi.

Il post-editing è il traghetto verso la singolarità. Si può svolgere interattivamente, o a posteriori sul risultato di una traduzione automatica.

Se alimentato con dati linguistici opportunamente strutturati provenienti da memorie di traduzione, Lilt può risultare uno straordinario strumento di post-editing su file bilingue. Purtroppo, le modifiche apportate da un singolo utente interessano solo il dataset associato al suo account e l’attività in corso. In altre parole, Lilt non è un ambiente per la traduzione collaborativa. Non ancora.

Ciò significa che, perché Lilt possa funzionare efficacemente in progetti PEMT di grandi dimensioni che coinvolgono più editor, è essenziale disporre di istruzioni precise e che gli editor vi si attengano scrupolosamente. E questo è un problema serio. Un computer non infrange mai le regole, mentre il libero arbitrio permette agli esseri umani di farlo.

Infine, anche se il cloud computing è ormai cosa comune, Lilt può ancora presentare ostacoli che molti operatori del settore considerano importanti, perché è disponibile solo su cloud, e questo richiede una connessione Internet veloce, o per la controversa, ancorché ripetutamente demistificata, questione della protezione dei dati per motivi di proprietà intellettuale, e tutto questo malgrado una tipica PMI disponga e sia interessata a dotarsi delle risorse necessarie per gestire l’enorme quantità di dati richiesti.

In conclusione, quando si entra in affari lo si fa per denaro, il che non è necessariamente un male se non si fa del male, pecunia non olet, e i soldi di solito vengono dai clienti, il cui requisito primario si può riassumere in “Dammi qualcosa che possa capire”.

Le tecnologie più profonde sono quelle che scompaiono.
Mark Weiser, The Computer for the Twenty-First Century, Scientific American, 1991, pp. 66–75


* 10 è un film del 1979 in cui il protagonista valuta le donne per il loro aspetto da 0 a 10, secondo una scala ampiamente condivisa perché di facile comprensione.

Autore: Luigi Muzii

Luigi Muzii