IA: la comprensione non è nel testo

Quattrociocchi: IA e il concetto di epistemia

In un bel post su LinkedIn, Walter Quattrociocchi ci aggiorna su uno dei nodi centrali del dibattito sull’Intelligenza artificiale, che non riguarda – come molti sono pronti a credere – stabilire se i modelli linguistici stiano diventando intelligenti, ma riconoscere che, di fronte alle loro prestazioni, siamo noi a spostare progressivamente il significato della parola “intelligenza”. I risultati sperimentali che cita – confronti tra esseri umani e modelli linguistici su test classici di psicologia e neuroscienze – mostrerebbero infatti una somiglianza solo superficiale: le risposte possono apparire umane, ma i processi che le producono sarebbero completamente diversi. Fin qui non c’è nulla di particolarmente sorprendente per chi abbia una minima familiarità con il funzionamento dei modelli.

La differenza starebbe, sempre in quel che ci racconta l’autore, nel rapporto con il mondo. Gli esseri umani interpretano il linguaggio collegandolo a esperienza, causalità, memoria e norme, cioè valutano ciò che dicono in termini di verità. I modelli invece lavorano su correlazioni statistiche nei testi: non giudicano, ma prevedono; non verificano, ma stimano la plausibilità di una continuazione. Da qui il concetto proposto di “epistemia”: la situazione in cui un linguaggio estremamente fluente diventa indistinguibile, per chi lo osserva, dalla conoscenza autentica. E anche su questo siamo sostanzialmente d’accordo.

Chi arriva da studi di scienze cognitive ha abbastanza chiaro qual era il “mantra” in passato: la conoscenza sarà sempre imperfetta senza un corpo, senza incorporazione (embodiment), che permetta un’esperienza di “prima mano” del mondo. Insomma siamo al cervello in una vasca di Hilary Putnam.

Il problema, quindi, non sarebbe che i modelli sbagliano – anche gli esseri umani lo fanno – ma che un sistema basato su approssimazioni statistiche non ha accesso alla realtà cui le parole si riferiscono e non può sapere quando sta allucinando. Affidargli compiti di giudizio significherebbe allora trasformare la conoscenza da relazione tra mente e mondo a relazione tra richiesta e distribuzione di probabilità. Per questo l’autore conclude che scorrevolezza, intuizione e verità non coincidono: un discorso plausibile e ben formulato non equivale a comprensione.

Come funzionano le predizioni dell’IA e degli esseri umani

Giudicare è diverso da predire (l’umano giudica, mentre il modello predice) e un LLM non ha accesso al mondo (verrebbe da dire: per il momento): non vede oggetti, non ha corpo, non ha conseguenze delle proprie affermazioni, non ha responsabilità epistemica. Opera su una cosa sola: coerenza statistica del linguaggio.

Quando un essere umano dice «questo vetro si romperà» sta facendo una predizione che si basa su diversi elementi:

1) una memoria di eventi passati, in cui i vetri si sono rotti;

2) una causalità fisica interiorizzata, basata su nozioni quali la “frangibilità” di un oggetto;

3) una simulazione mentale;

4) un’esperienza sensoriale diretta, sempre legata all’esperienza di vetri infranti;

5) delle semplici aspettative pragmatiche.

Quando un modello compone la stessa frase, sta facendo un’inferenza del tipo: dato il contesto linguistico, questa continuazione ha alta probabilità. Questa, come abbiamo accennato, è anche la ragione per cui i modelli non “sanno” di allucinare: non possiedono una procedura interna di confronto col mondo.

Correlazione e conoscenza: quando gli esseri umani fanno pattern recognition

Ciò su cui forse si può essere meno d’accordo con Quattrociocchi è quando pone il confronto tra “correlazione” e “conoscenza”. L’argomento implicito è: senza contatto col mondo non può esistere conoscenza. È la “vecchia scuola” alla Putnam. È una tesi forte (perché ha una tradizione consolidata), confortante (perché mette di nuovo noi al centro), ma non ovvia (anche se così ci appare: come possiamo conoscere qualcosa se non attraverso l’esperienza? E chi può fare esperienza se non noi? È un po’ come l’idea che si possa pensare senza possedere parole, senza verbalizzare: semplicemente ci sembra impossibile…). In filosofia della conoscenza è una posizione precisa: realismo referenziale incarnato, ovvero la posizione secondo cui il riferimento alla realtà e la possibilità stessa di conoscere dipendono dal fatto di possedere un corpo, “interfaccia” con il mondo.

Qui però sembra nascere un problema perché a ben guardare molte nostre conoscenze umane funzionano esattamente come modelli linguistici. Tra gli esempi possiamo senz’altro citare la matematica pura (di cui è difficile “fare esperienza diretta”…), il diritto, la teologia, parte enorme della storia, gran parte della medicina clinica, la diagnosi psicologica. Tutte discipline (o parti di discipline) che sono frutto di costruzione logica, di una “raffinazione” del pensiero tale da essere molto distante da qualcosa che chiamiamo esperienza. In questi casi anche l’umano lavora su reti di coerenze simboliche e inferenze statistiche interne: il medico esperto spesso riconosce una sindrome prima ancora di sapere “perché”. Si tratta letteralmente di pattern recognition.

Quindi la differenza non è tanto tra “linguaggio” e “realtà” quanto piuttosto sul “tipo di ancoraggio” alla realtà. O almeno: così ci sembra. Quattrociocchi, che è l’artefice del concetto di “epistemia”, ha avuto sicuramente una intuizione brillante, che però porta con sé un’ambiguità. La sua distinzione è corretta ed è certamente da sottoscrivere: quando il linguaggio fluente diventa indistinguibile dalla conoscenza noi umani siamo a rischio perché non abbiamo modo di distinguere se quel linguaggio è realmente rappresentativo di una conoscenza o è solo frutto di concatenazioni statistiche di plausibilità. Ma questo non descrive tanto l’IA – che sappiamo già essere così – quanto descrive noi o meglio un nostro “punto debole”. Gli esseri umani da sempre (mediamente) confondono l’eloquenza con la competenza; la sicurezza nell’esprimere le proprie opinioni con la verità delle stesse; la narrazione con la spiegazione. In sostanza, se ci mettiamo in quest’ottica, alla fine i modelli linguistici non fanno altro che amplificare un bias cognitivo antico: la mente umana scambia la “forma” della spiegazione come segno di comprensione.

In questo senso l’IA è più uno specchio epistemologico che un agente epistemico.

Quello che nel discorso di Quattrociocchi sembra eccessivo – ma forse è un modo per sottolineare “didatticamente” le differenze – è l’opposizione tra «la scorrevolezza non è comprensione» (o in alternativa: «la fluidità non è intuizione») e «la plausibilità non è verità». Attenzione: questo è vero ma in una certa misura anche incompleto perché, per rimanere in ambito scientifico:

1) quasi tutte le ipotesi iniziano come plausibilità;

2) gran parte del ragionamento umano è euristico;

3) la comprensione precede la verifica.

Forse, verrebbe da dire, non è un caso che le IA abbiano permesso progressi in ambiti scientifici, come gli ultimi due in ordine di tempo: il primo legato alla fisica teorica sulle ampiezze di scattering che, al netto di titoli sensazionalistici, ha la sua rilevanza; il secondo riguarda la “nascita” di AlphaFold4, erede dell’IA che fece conferire il Nobel per la Chimica ad Hassabis nel 2024, su cui però già emergono, come c’è da aspettarsi, tutti i caveat sull’essere privata, blindata, non open source, ecc.

In generale il pensiero umano non è un confronto diretto continuo con la realtà, quanto piuttosto una continua generazione di modelli plausibili filtrati dall’esperienza.

Il problema della responsabilità

Ciò che qui diventa davvero rilevante è la responsabilità epistemica perché ciò che cambia non è l’intelligenza ma il soggetto che si assume il rischio cognitivo, o meglio appunto: la responsabilità dello stesso. Insomma prima dell’avvento dell’IA la frase “impegnava” chi la pronunciava e la sua reputazione cresceva o calava sulla base della veridicità o falsità della stessa. Adesso la frase è generata da un sistema senza impegno epistemico, quindi “senza responsabilità” e questo altera la pratica sociale della conoscenza più che la natura della conoscenza stessa.

Non è che l’IA non capisce – lo sappiamo che non capisce, nel senso che diamo alla parola “capire” – è che nessuno capisce al suo posto se l’umano smette di controllare. Il post di Quattrociocchi coglie bene un pericolo reale, evidenziato anche dall’articolo di «Scientific American», ma lo interpreta come un problema ontologico mentre è prima di tutto un problema pratico. Di fatto non stiamo ridefinendo l’intelligenza per adattarla all’IA quando piuttosto il lavoro cognitivo dell’essere umano: prima pensare significava produrre e verificare; ora significa selezionare e verificare. Quindi sembra che la vera frattura non sia tra mente e statistica ma tra conoscenza come attività e conoscenza come output. E l’IA rende facilissimo scambiare la seconda per la prima.

Intelligenza, modelli e linguaggio

Il “difetto” della prospettiva di Quattrociocchi è la seguente concatenazione: i modelli non conoscono il mondo → quindi non giudicano → quindi non sono intelligenti → e noi stiamo deformando il concetto di intelligenza.

Se siamo disposti a cambiare di qualche grado la prospettiva sulla base delle considerazioni sin qui fatte vediamo che i modelli linguistici non stanno falsificando (o “modificando”) il concetto di intelligenza ma stanno evidenziando il fatto che una parte significativa dell’intelligenza umana è sempre stata distribuita tra individuo, linguaggio e ambiente sociale. In sostanza non stiamo ridefinendo l’intelligenza per adattarla all’IA, ma stiamo scoprendo che non era dove pensavamo.

Il post di Quattrociocchi assume implicitamente una concezione classica: l’intelligenza è una capacità interna di una mente che si relaziona al mondo. Come accennato è un’idea molto radicata: la mente giudica, il linguaggio esprime. Ma il nostro funzionamento reale suggerisce altro, ovvero il fatto che ragioniamo parlando; pensiamo rendendo esplicito, esternalizzando attraverso la verbalizzazione, ciò che pensiamo; comprendiamo attraverso esempi; ricordiamo (sempre più) attraverso supporti; deduciamo tramite strumenti simbolici. Una certa quota del pensiero umano avviene fuori dal cervello, ma non metaforicamente: operativamente.

I modelli linguistici fanno una cosa sorprendente: tolgono corpo, esperienza e percezione, lasciando solo il linguaggio (ci viene da dire: chissà quando invece inizieranno a integrare tutto questo, cosa succederà!). Ora: se non emergesse nulla, il linguaggio sarebbe solo un mero canale di comunicazione. Invece abbiamo visto che emerge struttura cognitiva: inferenze, analogie, generalizzazioni, spiegazioni.

Questo quindi suggerisce una conclusione diversa da quella dell’articolo, ovvero: il linguaggio non è soltanto il veicolo del pensiero, ma è (anche) uno dei luoghi in cui il pensiero esiste. L’obiezione, l’abbiamo accennato, è che i modelli linguistici “non conoscono il mondo”, che è vero, ma, ancora una volta, racconta solo “metà della storia” perché neppure gran parte della conoscenza umana è accesso diretto al mondo. Sappiamo che i quasar esistono, che l’interno della Terra è fuso, che la peste è causata da Yersinia pestis e lo sappiamo certamente non per esperienza, ma per integrazione in una rete linguistica affidabile [1]. La differenza reale quindi, e vale la pena ribadirlo, non è: “esperienza” vs “testo” quanto piuttosto “catena epistemica con responsabilità” vs “catena senza responsabilità”.

Il modello linguistico si colloca in un nodo senza posizione epistemica. Il punto importante qui è che il giudizio non sparisce, si sposta, viene riallocato: prima l’autore produceva e verificava, adesso il sistema produce e l’umano verifica, se è in grado (il problema semmai è quello). In sostanza non vi è perdita di epistemologia quanto piuttosto redistribuzione del lavoro cognitivo, un po’ come è accaduto, con gradazioni diverse, con la scrittura, la stampa, la calcolatrice, il database, solo in una forma molto più radicale.

La vera novità che l’IA introduce è che per la prima volta possiamo separare chiaramente la generazione di strutture di senso e impegno epistemico verso la realtà. Queste due cose, prima dell’IA, negli esseri umani erano fuse e quindi confuse, mentre gli LLM le dissociano.

Questo sta producendo lo shock culturale a cui assistiamo. L’errore non è credere che il modello capisca. Ma credere che capire coincida con il generare spiegazioni.

La comprensione non è la produzione del significato ma è la responsabilità del significato.

In definitiva, e per concludere, i modelli linguistici non imitano l’intelligenza umana: isolano una delle sue componenti – la produzione di strutture di senso – mostrando che la conoscenza non è mai stata un fatto puramente mentale, ma una pratica sociale di validazione.

Immagine di copertina: Vecteezy

[1] Senza voler addentrarsi in questioni religiose o di altra natura, ma che la parola abbia avuto sempre un ruolo fondamentale è chiaro sin dagli albori della tradizione nella quale siamo – che ci piaccia o meno – collocati: «In principio era il Verbo, | il Verbo era presso Dio | e il Verbo era Dio», recita l’incipit al Vangelo di Giovanni. E il “Verbo” qui sta, in prima battuta, per “parola” (poi anche per “ragionamento” e altro), perché, come dice in un bel romanzo (Accabadora) Michela Murgia, «è con la parola che Dio ha fatto il mondo».

Luciano Celi

Luciano Celi ha conseguito una laurea in Filosofia della Scienza, un master in giornalismo scientifico presso la SISSA di Trieste e un secondo master di I livello in tecnologie internet. Prima di vincere il concorso all'Istituto per i Processi Chimico-Fisici al CNR di Pisa, ha fondato con Daniele Gouthier una piccola casa editrice di divulgazione scientifica. Nel quinquennio 2012-2016 ha coordinato il comitato «Areaperta» (http://www.areaperta.pi.cnr.it), che si occupa delle iniziative di divulgazione scientifica per l'Area della Ricerca di Pisa ed è autore, insieme ad Anna Vaccarelli, della trasmissione radio «Aula 40» (http://radioaula40.cnr.it/). Nel giugno 2019 ha discusso la tesi di dottorato in Ingegneria Energetica.

In questa Rubrica

Sull’intervista a Claude fatta da Walter Veltroni

di Luciano Celi

L’IA e i 25 anni di Wikipedia

di Luciano Celi

Turing, il test, l’umanità

di Luciano Celi