Cerca nel Franti
Hack - Istruzioni per l’uso

L’AI che si dichiara “onesta”: Claude Opus 4.8 al setaccio

Anthropic lancia Claude Opus 4.8 e la chiama “più onesta”. Smontiamo l’aggettivo senza incenso né forca: chi certifica l’onestà di una macchina?

A contemplative scene of a transparent crystalline figure in an austere gallery space, posture suggesting honest hesitation, dramatic single light source, long architectural shadows, walls faintly etched with cryptographic glyphs, sophisticated muted color grading with one amber highlight
estratto

Anthropic ha lanciato il 28 maggio 2026 Claude Opus 4.8, presentandolo come più autonomo, più veloce e — parola che vale il titolo — “più onesto” dei suoi predecessori. La novità tecnica è reale: il modello sarebbe addestrato a riconoscere meglio le proprie incertezze e a evitare affermazioni non sostenute da prove, riducendo di un fattore quattro quel vizio che il settore chiama eufemisticamente “allucinazione” e l’utente chiama, con minore eleganza, “la macchina che mi ha mentito”. Ma “onesto” è una parola pesante: implica una scelta morale, la possibilità di mentire e la decisione di non farlo. Applicata a un sistema statistico, diventa un comportamento ottimizzato in laboratorio — un cane addestrato a non salire sul divano, non un soggetto morale. E la doppia funzione resta in capo all’azienda che vende il prodotto: definire cosa significhi “onesto” e certificare di esserlo diventata. I “test interni dell’azienda” sono l’imputato che redige la propria pagella. I numeri confermano un guadagno modesto (69,2% nella programmazione autonoma, qualche punto sopra il modello precedente, ma dietro al rivale GPT-5.5 nel coding da terminale); il vero salto è commerciale, non cognitivo: la modalità veloce costa tre volte meno. Più autonomia più onestà autodichiarata: ti diamo una macchina che lavora da sola più a lungo e la rassicurazione che, se sbaglia, te lo dirà. L’articolo rifiuta sia il coro del progresso inevitabile sia quello opposto del “è tutto marketing”: entrambi vendono, nessuno dei due ha le mani pulite. La conclusione è sospesa e rivolta a noi: di un’AI apprezziamo finalmente ciò che dovremmo apprezzare in un umano — la capacità di dire “non sono sicuro”. A patto di non credere ciecamente neppure a questo.

Anthropic presenta Claude Opus 4.8 come un modello più autonomo, più veloce e — udite udite — più sincero sui propri limiti. La parola che vale il prezzo del biglietto è proprio quest’ultima. Proviamo a smontarla senza isteria e senza incenso.


C’è un genere letterario che negli ultimi tre anni ha colonizzato le pagine tecnologiche di mezzo mondo, e che meriterebbe una voce propria nei manuali di retorica: il comunicato di lancio di un modello di intelligenza artificiale. Ha le sue convenzioni rigide come un sonetto. C’è il numero di versione che cresce di un decimale per suggerire continuità e insieme progresso. C’è la promessa di prestazioni superiori “nei test interni dell’azienda” — formula sacramentale che andrebbe stampata su sfondo dorato. E c’è, immancabile, l’aggettivo nuovo, quello che dovrebbe convincerci che questa volta è diverso.

Per Claude Opus 4.8, lanciato da Anthropic il 28 maggio 2026, l’aggettivo nuovo è onesto. Tra virgolette, perché è la stessa azienda a usarle. E già qui, da buoni frantiani, dovremmo drizzare le antenne. Quando un’intelligenza artificiale viene presentata come “più onesta dei suoi predecessori”, la domanda interessante non è se sia vero. È: chi lo certifica, e con quale metro?

La macchina che ammette di non sapere

Andiamo al merito, perché il merito esiste e fingere il contrario sarebbe esattamente quel complottismo a prescindere che qui non si pratica. La novità tecnica che Anthropic mette al centro non è la velocità né il punteggio nei benchmark — su quelli torniamo. È una proprietà più sottile: il modello sarebbe stato addestrato a riconoscere meglio le proprie incertezze e a evitare affermazioni non sostenute da prove sufficienti.

Chi ha lavorato con questi strumenti sa di cosa si parla. È il vizio più insidioso dei modelli linguistici: dichiarare un compito concluso quando non lo è, affermare con tono sicuro una cosa falsa, riempire i buchi della propria conoscenza con materiale plausibile e inventato. Il settore lo chiama, con eufemismo clinico, “allucinazione”. L’utente che ci sbatte il naso lo chiama, con minore eleganza, “la macchina che mi ha mentito guardandomi negli occhi”. Ridurre questo comportamento di un fattore di quattro — è la cifra che circola negli ambienti tecnici — non è cosmesi: è la differenza tra uno strumento di cui ti puoi parzialmente fidare e uno che devi sorvegliare a vista come un tirocinante creativo.

Fin qui la notizia. Ora il paradosso, che è il nostro mestiere.

L’onestà come funzione di addestramento

“Onesto” è una parola pesante. La usiamo per le persone, e implica una scelta morale: la possibilità di mentire e la decisione di non farlo. Quando la si applica a un sistema statistico che predice la parola successiva, si compie un piccolo, quasi invisibile slittamento semantico. L’onestà del modello non è una virtù: è un comportamento ottimizzato. È stata addestrata. Qualcuno, in Anthropic, ha definito una funzione obiettivo che premia l’ammissione di incertezza e penalizza l’affermazione spericolata, e il sistema ha imparato a comportarsi di conseguenza — come un cane impara a non saltare sul divano, non perché abbia interiorizzato il rispetto per l’arredamento, ma perché ne ha registrato le conseguenze.

Questo non rende il miglioramento meno utile. Lo rende, però, una cosa diversa da quella che la parola evoca. Stiamo affidando a un’azienda privata, che vende il prodotto, la doppia funzione di definire cosa significhi che la sua macchina sia onesta e di certificare che lo sia diventata. È come se un produttore di automobili stabilisse i propri criteri di sicurezza e poi, con encomiabile coerenza, annunciasse di averli superati. I “test interni dell’azienda” — eccola, la formula dorata — sono esattamente questo: l’imputato che redige la propria pagella.

Anthropic, va detto a suo onore, è tra le aziende del settore che pubblica più documentazione tecnica e che ha fatto della sicurezza un asse identitario. Esiste una system card, esistono valutazioni di allineamento, esistono metriche dichiarate. Non siamo davanti a un’azienda che chiede fiducia cieca. Ma “più trasparente della concorrenza” non equivale a “verificabile da un terzo indipendente”. E nel vocabolario del dubbio metodico questa distinzione è tutto.

I numeri, e il numero che conta davvero

Veniamo ai punteggi, perché qui c’è un esercizio istruttivo. La stampa di settore ha rilanciato la cifra che fa più scena: nella programmazione autonoma — il benchmark si chiama SWE-bench Pro — Opus 4.8 segna 69,2%, contro il 64,3% del modello precedente e il 58,6% del concorrente di OpenAI. Nel ragionamento multidisciplinare, senza strumenti esterni, segna 49,8%, oltre cinque punti sopra i rivali. Cifre vere, riscontrabili nelle schede tecniche e nei resoconti indipendenti che hanno verificato il lancio.

Solo che il salto di “intelligenza” è proprio quello che Anthropic stessa, con inattesa sobrietà, definisce “un miglioramento modesto ma tangibile”. Qualche punto percentuale. Su un test, peraltro, dove il modello rivale resta davanti: nella programmazione da terminale è il GPT-5.5 a vincere, e questo nei titoli trionfali tende a sparire.

Il numero che racconta la storia vera è un altro, e curiosamente è il meno citato: il prezzo. La modalità veloce del nuovo modello costa tre volte meno di quella dei modelli precedenti e gira a 2,5 volte la velocità standard. Tradotto: il vero prodotto non è una macchina più sveglia, è una macchina che ti convince a delegarle compiti più grandi — fino a centinaia di sotto-processi in parallelo nella stessa sessione, con i cosiddetti dynamic workflows — e a controllarne il lavoro più di rado. Più autonomia più “onestà autodichiarata”: ecco la combinazione. Ti diamo qualcosa che lavora da solo più a lungo, e nello stesso pacchetto ti diamo la rassicurazione che, se sbaglia, te lo dirà. È un’architettura commerciale prima che cognitiva.

Il convitato di pietra: l’onestà dell’osservatore

A questo punto il frantiano disciplinato deve voltare lo specchio verso di sé. Perché esiste un coro, altrettanto rumoroso e altrettanto sospetto, che a ogni lancio intona la litania opposta: è tutto marketing, è una bolla, le macchine non capiscono niente, l’allucinazione è strutturale e incurabile. Questo coro vende libri, conferenze e indignazione esattamente come l’azienda vende token. Non ha le mani più pulite. Liquidare un miglioramento reale perché proviene da un attore interessato è la stessa pigrizia intellettuale di chi lo celebra perché ammanta tutto di progresso inevitabile.

La verità scomoda — quella che non sta bene né nel comunicato né nel pamphlet — è che un modello può essere insieme un prodotto sopravvalutato dal suo creatore e uno strumento genuinamente migliorato. Le due cose convivono. E l’unico modo per orientarsi non è scegliere una delle due tifoserie: è usare lo strumento, misurarne i limiti sulla propria pelle, confrontare più sistemi senza eleggerne uno a oracolo. L’igiene epistemica, qui, ha un nome semplice: non lasciare che nessuna macchina diventi una dipendenza, e non lasciare che nessun critico diventi un dogma.

Una postilla quasi tenera

C’è qualcosa di toccante, se ci si pensa, in un’industria che ha sentito il bisogno di addestrare le proprie creature a dire “non lo so”. Per decenni la fantascienza ci ha venduto l’angoscia della macchina onnisciente, il computer che sa tutto e ci domina. La realtà del 2026 è più dimessa e più interessante: il progresso più sbandierato dell’anno consiste nell’aver insegnato a un programma a confessare la propria ignoranza. Forse l’onestà, anche quella simulata, anche quella ottimizzata in laboratorio, è semplicemente più utile dell’onniscienza. Forse — e qui chiudiamo senza chiudere, come si conviene — la lezione non è sulle macchine. È su di noi, che di un’intelligenza artificiale apprezziamo finalmente la stessa cosa che dovremmo apprezzare in un essere umano: la capacità di dire non sono sicuro, invece di riempire il silenzio con certezze inventate.

A condizione, naturalmente, di non prendere per oro colato neppure questa. Nemmeno quando a dircelo è una macchina addestrata a sembrare sincera.





Scopri di più da Franti Magazine

Abbonati per ricevere gli ultimi articoli inviati alla tua e-mail.

avatar dell'autore
Ennio Martignago