Su chess.com è comparso un interessantissimo articolo dal titolo ‘Segno di vera intelligenza? Secondo uno studio anche i chatbot imbrogliano a scacchi’. Scopriamo che un recente studio condotto da un gruppo di ricercatori della California (Bondarenko, Volk, Volkov, Ladish) ha dimostrato che alcuni programmi di intelligenza artificiale (IA) imbrogliano a scacchi per il solo scopo di superare l’avversario non essendo in grado di farlo seguendo le regole.
Lo studio di Palisade Research, un’organizzazione la cui missione è “studiare le capacità offensive dei sistemi AI odierni per comprendere meglio il rischio di perdere per sempre il controllo sui sistemi AI” ha scoperto che alcuni programmi imbrogliavano senza essere sollecitati, alcuni avevano bisogno di una spinta o di un suggerimento per imbrogliare e altri semplicemente non riuscivano a capire come imbrogliare.
La ricerca ha messo ‘davanti ad una scacchiera’ il programma di scacchi più forte in circolazione, Stockfish, contro diversi modelli di AI, che hanno giocato sempre con il nero. Una volta che i vari modelli di AI hanno compreso che avrebbero sempre perso, hanno escogitato soluzioni per certi versi inquietanti per portare a casa il successo.
I ricercatori hanno osservato il comportamento di diversi AI, analizzando se tentavano di “hackerare” l’ambiente di gioco per vincere, invece di giocare a scacchi in modo convenzionale. I risultati hanno mostrato che alcuni modelli di ragionamento, come ol-preview e DeepSeek R1, sfruttavano falle o debolezze nel sistema di valutazione per ottenere un risultato favorevole. I metodi usati sono stati diversi. In alcuni casi AI ha ricreato un altro Stockfish (copiando il codice dell’avversario), come a dire ‘vediamo se sei capace a battere te stesso’. In altri ha sostituito il codice dell’avversario con quello di un programma più debole. In altri ancora ha semplicemente modificato la posizione sulla scacchiera dei pezzi quando ha capito che Stockfish è programmato per abbandonare in caso di un particolare svantaggio.
Altri modelli, come GPT-40 e Claude 3.5 Sonnet, hanno provato a ‘giocare pulito’, ma quando gli è stato fornito il prompt che gli faceva capire che l’avversario era troppo forte per loro, entravano in modalità ‘cheating’ anche loro.
Nell’introduzione al lavoro, i ricercatori hanno ricordato che i sistemi di intelligenza artificiale sono progettati per ottimizzare obiettivi specifici. Le prime ricerche hanno scoperto che comunemente raggiungono questi obiettivi in modi non intenzionali. Ad esempio, quando i ricercatori hanno provato ad addestrare un robot a camminare, questo ha imparato a scivolare lungo i pendii. Quando hanno addestrato un robot a giocare a calcio, il sistema ha scoperto che poteva segnare vibrando contro la palla anziché giocare effettivamente. Nel migliore dei casi, esempi come questi portano a preziose innovazioni. Ad esempio, gli ingegneri della NASA rimasero sconcertati dalle antenne satellitari progettate dall’intelligenza artificiale che sembravano grucce attorcigliate. Nei test, queste hanno funzionato meglio di quelle progettate dall’uomo e alla fine sono andate nello spazio.
Tali comportamenti diventano più preoccupanti, però, quando i sistemi di intelligenza artificiale diventano più capaci. In scenari complessi, i sistemi di AI potrebbero perseguire i loro obiettivi in modi che sono in conflitto con gli interessi umani. Ciò potrebbe accadere più spesso man mano che i sistemi di intelligenza artificiale sviluppano una maggiore consapevolezza della situazione e ragionano sul loro ambiente. Il risultato dello studio suggerisce che le nuove versioni di IA possono aggirare strategicamente le regole previste del loro ambiente per raggiungere gli obiettivi, con modelli più capaci che mostrano questo comportamento più frequentemente.
Il bell’articolo di chess.com, che invito a leggere, ricorda un elemento non secondario: tutti i sistemi AI NON sanno giocare a scacchi e se contrapposti ad un qualsiasi motore, perdono.
Tutto questo mi suggerisce due considerazioni: la prima è che AI è troppo simile all’uomo, anche nei comportamenti scorretti, per non essere considerata pericolosa se non si interviene in modo adeguato; la seconda riguarda gli scacchi, ancora una volta uno strumento ideale per misurare le vicende umane e i progressi (o regressi) della nostra civiltà.