I generatori automatici di testi fanno pensare i computer

C'è il “generatore automatico di post di Salvini” e quello che crea gli “annunci renziani” o le “risposte grilline”. C'è perfino il “generatore automatico di lauree”, ispirato al titolo di studio più “fake” della storia italiana, quello ottenuto da Renzo Bossi in Albania. Il pubblico italiano li ha conosciuti così, nella loro versione giocosa di satira politica, eppure i generatori automatici, che sempre più spopolano nel web, sono qualcosa d'incredibilmente serio. Algoritmi senz'anima sono già in grado di sfornare falsi emendamenti in gran quantità (vedi il caso Calderoli), ma anche bollettini meteo e resoconti sportivi. I sistemi per la generazione automatica di linguaggio naturale (Natural Language Generation) sono un tema sempre più caldo per la comunità scientifica. Rappresentano un importante ambito di studio del Machine Learning Lab (MaLeLab), laboratorio inserito all'interno del Dipartimento d'Ingegneria e Architettura dell'Università di Trieste, che si occupa di scovare metodi e tecniche per “insegnare” alle macchine a svolgere dei compiti senza programmarle esplicitamente, ma fornendo loro semplicemente una serie di esempi, da cui la macchina deduce lo schema di realizzazione.
«Ci sono due fattori che portano a pensare a una sempre più ampia applicazione dei sistemi di Nlg: da un lato la macchina è sempre più brava a spacciarsi per essere umano – spiega Eric Medvet, braccio destro del direttore del MaLeLab, Alberto Bartoli -, dall'altro l'uomo è sempre più abituato ad avere a che fare con le macchine».
Proprio dal MaLeLab è stato ideato di recente un “generatore automatico di recensioni di articoli scientifici” che ha suscitato l'interesse del prestigioso periodico britannico Times Higher Education. «È un lavoro nato per gioco, con l'intento di provocare la comunità scientifica – spiega Medvet – ma anche di indagare le potenzialità di questa tecnica».
Nel mondo della ricerca, racconta Medvet, il processo di revisione di articoli scientifici ricopre un ruolo fondamentale: stabilisce quali sono gli articoli meritevoli di pubblicazione o di essere illustrati in ambito conferenziale. «Ma c'è un problema di scala, perché nel mondo c'è sempre più gente che fa ricerca e, poiché siamo valutati sulla quantità di articoli scientifici che sforniamo, ciò spinge a pubblicare sempre di più. Di conseguenza aumenta il lavoro per i revisori. E proliferano le riviste disposte a pubblicare articoli scientifici a pagamento».
Utilizzando il software di generazione automatica del testo gli informatici del MaLeLab hanno creato una serie di false “peer review” di articoli scientifici e hanno chiesto agli accademici di valutarle. In un caso su quattro gli esperti si sono dichiarati in accordo con le revisioni generate dal computer.
«Per istruire la macchina – racconta Medvet – le abbiamo fornito un corpus di revisioni vere prese da diversi ambiti scientifici, dalle neuroscienze all'astrofisica. Combinando frasi estrapolate da queste revisioni, operando alcune sostituzioni di termini, dichiarando alla macchina che tipo di revisione si vuole ottenere, se positiva, negativa o neutra, e mantenendo fisso lo schema della recensione scientifica, dal cappello iniziale alle conclusioni, si ottengono frammenti di testi che di primo acchito sembrano davvero scritti da esseri umani».
Un esperimento simile era già stato fatto al Mit nel 2005 per la generazione automatica di articoli scientifici: la rivista “Nature” nel febbraio del 2014 aveva rivelato che 120 articoli generati in questo modo erano già stati pubblicati a livello internazionale. Gli ambiti d'utilizzo dei generatori automatici di testo sono potenzialmente infiniti. Un altro interessante esperimento realizzato recentemente al MaLeLab riguarda un “generatore automatico di recensioni di ristoranti”, che Medvet presenterà a metà ottobre all'International Conference on Web Intelligence che si terrà a Omaha, in Nebraska.
Riproduzione riservata © Il Piccolo