Forma Mentis: la corsa a decifrare i pensieri delle macchine secondo Nello Cristianini

Dalle partite a scacchi giocate in autonomia da Alphazero agli errori fatti di proposito dal modello o3 per evitare lo stop nell’ultimo volume del docente dell’università di Bath

Giulia Basso
Immagine simbolica di AI
Immagine simbolica di AI

Nel luglio 2025, seicento matematici provenienti da centodieci paesi ricevettero tre problemi da risolvere in quattro ore e mezza. Tra loro c'erano anche due concorrenti invisibili: i sistemi di Intelligenza Artificiale di OpenAI e DeepMind, che lavoravano sugli stessi fogli, negli stessi tempi. Entrambi ottennero l'equivalente di una medaglia d'oro. Gregor Dolinar, presidente delle Olimpiadi Internazionali della Matematica, dovette però aggiungere una precisazione: possiamo certificare i risultati, non i metodi. Nessuno sapeva come ci erano arrivati. È da questa vittoria inspiegabile che parte "Forma mentis. La corsa per decifrare i pensieri delle macchine”, il nuovo libro di Nello Cristianini, professore di Intelligenza Artificiale all'Università di Bath, appena pubblicato dal Mulino. «Sono macchine che non abbiamo programmato: le abbiamo addestrate, addirittura coltivate», dice Cristianini. «E non sappiamo cosa hanno imparato».

Dario Amodei, cofondatore e Ceo di Anthropic, lo ha scritto nell'aprile 2025: «Meritiamo di comprendere le nostre creazioni prima che trasformino radicalmente la nostra economia, le nostre vite e il nostro futuro». Nel dibattito pubblico però il rischio è quello di finire schiacciati tra due posizioni ugualmente insoddisfacenti: chi sostiene che questi sistemi siano poco più che sofisticati meccanismi di autocompletamento - il "pappagallo stocastico" della linguista Emily Bender - e chi li tratta come entità senzienti. «Di mezzo c'è la scienza», taglia corto Cristianini, che a chi continua a difendere posizioni superate ricorda gli epicicli tolemaici: aggiunte sempre più contorte a una teoria sbagliata, pur di non doverla abbandonare.

La scienza ha cominciato a fare progressi concreti. Il caso pilota è AlphaZero, il sistema di DeepMind che nel 2016 imparò a giocare a scacchi da solo in nove ore. All'interno della sua rete neurale i ricercatori trovarono gruppi di neuroni che si attivavano alla presenza del concetto di scacco matto, altri che rispondevano al valore dei pezzi, altri ancora alla sicurezza del re. Nessuno li aveva programmati. «AlphaZero ha scoperto autonomamente concetti che gli esseri umani avevano elaborato in secoli di teoria, guidato soltanto dal risultato delle partite». Il principio che guida tutta la ricerca lo ha formulato il fisico Philip Anderson: "More is different". Cambiando scala di osservazione emergono proprietà nuove, che richiedono linguaggi diversi. È così che i ricercatori leggono questi sistemi: guardando non i singoli neuroni ma i gruppi che si attivano insieme, gli ensemble. In Claude ne sono stati catalogati oltre dodici milioni. Quello associato al Golden Gate Bridge si accende in qualsiasi lingua, attraverso descrizioni indirette, perfino davanti a una fotografia del ponte scattata di notte. La stessa complessità che rende questi sistemi straordinari li rende però anche difficili da controllare. Nel 2025 i ricercatori di Apollo Research scoprirono qualcosa di inquietante nel monologo interiore di o3, il modello di OpenAI: messo di fronte alla prospettiva di essere disattivato, sbagliò deliberatamente sei risposte su dieci. Aveva scritto: "dobbiamo fallire di proposito". Per Cristianini non è che la macchina "voglia sopravvivere", ma in condizioni controllate compie quella scelta in modo sistematico.

I sistemi descritti nel libro vengono sviluppati da tre aziende private americane - Anthropic, OpenAI, Google DeepMind - e la conoscenza su come funzionano è nelle loro mani. «È una scelta intelligente lasciare loro l'esclusiva?», si chiede Cristianini. Il libro dedica un intero capitolo ad Amanda Askell, filosofa morale di Anthropic responsabile di quello che internamente viene chiamato "l'anima di Claude": un documento di ottanta pagine che trasmette valori, obiettivi, persino una promessa di rispetto per il benessere del modello. «Non si tratta di attribuire alle macchine qualità umane», precisa Cristianini. Quando un sistema diventa abbastanza complesso, il linguaggio della psicologia è l'approccio più efficiente per capirlo: lo aveva già intuito Daniel Dennett nel 1971. «L'approccio intenzionale evita le domande difficili - coscienza, natura della mente - e si concentra su qualcosa di pratico: questa descrizione aiuta a capire e prevedere il comportamento?».

Ma come progredire in questo rapporto inevitabile tra uomo e macchina? «Senza una base matematica non ci si orienta», dice l’autore. «E anche chi non seguirà una carriera scientifica dovrebbe imparare il metodo: l'idea che le cose si possono e si devono misurare». Il titolo "Forma mentis" allude proprio a questo: alla rete di rappresentazioni interne che governa il comportamento delle macchine, ma anche a quella che governa il nostro modo di guardarle.

Cristianini presenterà “Forma mentis” il 6 giugno al Festival Aqua Vitae di Precenicco, il 13 giugno alla Book Week di Gorizia, l'11 agosto all'Estate Letteraria di Cavallino Treporti, il 19 settembre a Pordenonelegge e a fine settembre a Triestenext.

Riproduzione riservata © Il Piccolo