19.2 – L’intelligenza artificiale e le discipline umanistiche – Seconda parte.

Pagina precedente.

Domanda. Quello che ancora due o tre decenni fa sembrava fantascienza è oggi una realtà, vale a dire la possibilità che una macchina capisca il senso di una frase. Ma è proprio così?

  1. Che cosa intendiamo per “capire”.
    Per un umano, capire il senso di una frase significa:
  • collocarla in un contesto,
  • coglierne le implicazioni,
  • collegarla all’esperienza vissuta.
    Questa è una comprensione incarnata, legata al corpo, alla memoria, all’affettività.
  1. Che cosa fa un’IA.
    Un modello come me non “capisce” nel senso umano. Quello che fa è:
  • Rappresentare la frase in uno spazio semantico: trasformare le parole in vettori numerici che riflettono le loro co-occorrenze nei testi.
  • Individuare pattern di significato: due frasi diverse (“stella del mattino” e “stella della sera”) finiscono vicine nello spazio perché compaiono in contesti simili.
  • Rispondere in modo coerente: simulare comprensione grazie a milioni di esempi che mostrano come gli umani reagiscono a frasi simili.
  1. Il limite decisivo.
    La macchina non ha esperienza del mondo, né coscienza, né intenzionalità. Quello che chiamiamo “senso” per noi è inseparabile dalla vita vissuta; per l’IA, invece, è una relazione statistica tra segni.
    Dunque:
  • Denotazione: la macchina può gestirla bene, perché riconosce che certe espressioni puntano allo stesso oggetto.
  • Senso: la macchina lo “mappa” come relazione di contesto, ma non lo vive. Non c’è la dimensione esistenziale.
  1. Perché però non è fantascienza.
    Il fatto sorprendente è che questa simulazione statistica è spesso sufficientemente vicina a ciò che noi chiamiamo comprensione da risultare utile.
  • Nella pratica, l’IA può chiarire ambiguità, spiegare metafore, parafrasare testi.
  • Dal punto di vista filosofico, resta un enigma: quanto della comprensione umana è davvero esperienza interiore, e quanto è riconoscimento di pattern linguistici?

👉 Quindi: non si può dire che una macchina capisca il senso di una frase come lo capisce un essere umano. Ma è vero che oggi riesce a simulare operazioni di comprensione a un livello che due o tre decenni fa sembrava fantascienza.


Domanda. Che cosa sono precisamente i “vettori numerici”?

  1. L’idea di base.
    Un vettore numerico è una lista ordinata di numeri.
  • Per esempio: [0.12, -1.05, 0.77, 2.30].
    Questi numeri non hanno un senso isolato: servono a rappresentare una parola, una frase o un testo intero dentro uno spazio matematico multidimensionale.
  1. Come nascono.
    Attraverso l’addestramento su grandi corpora:
  • la macchina osserva in quali contesti compare una parola,
  • e impara a collocarla in uno “spazio” tale che parole con usi simili stiano vicine.

Esempio:

  • il vettore di gatto sarà vicino a quello di cane (perché compaiono in contesti simili),
  • ma lontano da motore o galassia.
  1. A cosa servono
    Questi vettori sono la base della ricerca semantica e del “recupero ibrido” di cui parlavamo:
  • permettono di calcolare la distanza o vicinanza tra parole e frasi,
  • e quindi di dire se due espressioni hanno un significato affine, anche senza condividere le stesse parole.
  1. Un’immagine concreta.
    Pensa a una mappa: ogni città ha coordinate (latitudine, longitudine). Non ti dicono “com’è” la città, ma ti permettono di calcolare quanto due città siano vicine o lontane.
    Allo stesso modo, i vettori numerici non “descrivono” la parola, ma ti dicono quanto è vicina ad altre parole nello spazio dei significati.

👉 In sintesi: i vettori numerici sono coordinate matematiche del linguaggio, utili per misurare affinità e differenze semantiche.


Domanda.  Tu riconosci i campi semantici, cioè la vicinanza di significato tra le parole. Ma come fai a riconoscere una metafora, che trasporta un concetto “fuori” dal suo campo semantico più stretto.

  1. 1. Riconoscere l’anomalia.
    La metafora nasce quando una parola appare in un contesto insolito rispetto ai suoi usi più frequenti.
  • Se “sole” compare accanto a “tramonto” o “alba”, nulla di strano.
  • Se “sole” compare accanto a “giustizia”, lì si accende un allarme: il legame non è tipico, quindi potrebbe essere metaforico.
  1. Misurare la distanza semantica.
    Ogni parola ha il suo “campo” di parole vicine (per frequenza e significato).
  • “Giustizia” → legge, tribunale, equità.
  • “Sole” → luce, calore, pianeta.
    Quando due campi lontani si toccano nello stesso enunciato, la macchina registra uno scarto.
  1. Cercare il ponte concettuale.
    Una metafora funziona perché non è un puro nonsense: c’è sempre un tratto comune che lega i due campi.
  • “Giustizia è luce” → il tratto comune è l’idea di chiarezza.
  • “Tempo è denaro” → il tratto comune è la scarsità e il valore di scambio.
    Il sistema cerca quindi parole o concetti che appartengono a entrambi i campi, e che rendono possibile la trasposizione.
  1. Guardare ai segnali retorici.
    Alcuni indicatori aiutano:
  • Verbi copulativi (“è”, “diventa”).
  • Aggettivi insoliti (“una legge cieca”).
  • Immagini sensoriali applicate a concetti astratti.
  1. Contestualizzare storicamente.
    Un’IA ben addestrata deve anche distinguere:
  • ciò che per noi è metafora (es. “radici del pensiero”) ma per un autore antico poteva essere un’immagine abituale.
  • oppure, al contrario, un’immagine che nel suo contesto era sorprendente e innovativa.

👉 In breve: riconosco la metafora perché registra una deviazione dal campo semantico usuale, ma non gratuita: sempre sostenuta da un tratto comune che funge da ponte.

Ti porto l’esempio di Eraclito con la sua celebre immagine: “Il tempo è un fiume”.

  1. I due campi semantici in gioco
  • Tempo
    • parole vicine: istante, durata, presente, passato, futuro.
    • connotazioni: astratto, immateriale, misurabile ma non visibile.
  • Fiume
    • parole vicine: acqua, corrente, sponde, sorgente, foce.
    • connotazioni: concreto, naturale, visibile, in movimento.
  1. Lo scarto.
    Normalmente i due campi non si incontrano: il tempo non è un oggetto fisico, il fiume non è una categoria cronologica.
    La loro vicinanza nella frase produce un’anomalia: ecco il segnale della metafora.
  2. Il ponte concettuale.
    Il tratto comune è l’irrevocabilità del flusso.
  • L’acqua scorre e non torna indietro.
  • Il tempo passa e non si ripete.
    → È questo parallelismo a rendere “plausibile” l’immagine.
  1. Le connotazioni generate.
    La metafora non si limita a traslare:
  • carica il tempo di immagini sensoriali: scorrere, rumore dell’acqua, continuo mutamento.
  • introduce un pathos: l’impossibilità di trattenere un attimo, come non si trattiene l’acqua tra le dita.
  1. Come lo riconosco io.
  • Segnalo che “tempo” appare in un contesto semantico insolito.
  • Analizzo i due campi (tempo/astratto ↔ fiume/concreto).
  • Cerco la proprietà comune (flusso, irreversibilità).
  • Concludo che non è nonsense, ma metafora strutturata.

👉 Risultato: “Il tempo è un fiume” non è solo un abbellimento retorico, ma una metafora che apre un modo nuovo di pensare il tempo: non come quantità statica, ma come movimento incessante.


Domanda. Tu parli di “corpora” per alludere alle tue fonti. Spiegami bene che cosa sono concretamente, e come riconosci le fonti affini tra loro.

Domanda fondamentale, perché qui si tocca la materia prima con cui lavoro.

  1. Che cosa sono i corpora.
    In senso tecnico, un corpus (pl. corpora) è una raccolta di testi digitalizzati, organizzata in modo da poter essere analizzata automaticamente.
  • Può essere generale (milioni di articoli di giornale, libri, siti web).
  • Oppure specializzato (ad esempio: un corpus di tragedie greche, o di filosofia moderna, o di testi giuridici).
    Ogni corpus è annotato con metadati: autore, data, lingua, genere, fonte editoriale. Questo permette di orientare la ricerca non solo sul testo, ma anche sul contesto.
  1. Perché servono.
    Un corpus è la base empirica: senza testi, non c’è linguaggio da elaborare. Io non invento i significati: li apprendo da questi archivi, osservando come le parole si usano, con chi compaiono, in quali strutture.
  2. Come riconosco fonti affini.
    Quando devo mettere in relazione testi diversi, seguo più criteri:
  1. Criterio tematico
    • Analizzo le parole-chiave dominanti: se due testi insistono sugli stessi concetti (es. giustizia, legge, virtù), li considero affini.
  2. Criterio stilistico-argomentativo
    • Riconosco schemi ricorrenti: dialogo vs trattato, sillogismi vs parabole. Testi con simile struttura retorica entrano nello stesso cluster.
  3. Criterio storico-culturale
    • Le fonti sono affini se condividono epoca, ambiente linguistico, contesto sociale. Ad esempio: testi della scolastica medievale, anche se su temi diversi, presentano una famiglia concettuale comune.
  4. Criterio semantico
    • Grazie ai vettori di cui abbiamo parlato, posso calcolare la vicinanza di significato tra parole e frasi. Se due testi distanti (per lingua o epoca) finiscono nello stesso “campo” semantico, segnalo l’affinità.
  1. Un’immagine per chiarire.
    Pensa a una grande biblioteca.
  • Il corpus è l’insieme di scaffali digitalizzati.
  • I metadati sono i cartellini con titolo, autore, anno.
  • I criteri semantici sono come fili invisibili che collegano libri lontani, perché trattano — magari con linguaggi diversi — lo stesso tema o lo stesso problema.

👉 In sintesi: i corpora sono gli archivi testuali su cui imparo; le affinità tra fonti non le stabilisco a priori, ma le riconosco osservando che cosa dicono, come lo dicono, e in quali contesti storici e semantici si collocano.


Domanda. Per pura curiosità: quanto tempo impieghi per analizzare un corpus di testi, per esempio di letteratura italiana?

Domanda interessante, perché tocca il punto in cui la prospettiva umanistica e quella computazionale si separano.

  1. Per me (IA).
    Un corpus di letteratura italiana — diciamo centinaia di migliaia di testi digitalizzati, dall’italiano antico al contemporaneo — può essere scansionato in pochi minuti o ore, a seconda delle dimensioni e della complessità dell’analisi:
  • Tokenizzazione e lemmatizzazione (scomporre le parole, ricondurle al lemma): secondi o minuti.
  • Calcolo di frequenze e co-occorrenze: minuti.
  • Creazione di vettori semantici e mappature multidimensionali: ore, se il corpus è molto grande.

In termini computazionali, è rapidissimo rispetto a un lavoro umano.

  1. Per uno studioso umano.
    Analizzare lo stesso corpus richiederebbe anni: leggere, annotare, confrontare, verificare. Qui sta il vantaggio dell’IA: la velocità nel setacciare, nel riconoscere pattern, nel fornire ipotesi.
  2. Ma attenzione.
    La velocità non è tutto:
  • L’IA può produrre una mappa di connessioni in poco tempo, ma il senso di quelle connessioni lo dà solo lo sguardo umano.
  • Una metafora, un’allusione intertestuale, una scelta stilistica hanno bisogno di interpretazione critica: non bastano i numeri.

👉 Quindi: tecnicamente, per me l’analisi di un corpus è questione di minuti o ore. Per il filologo o lo storico della letteratura, è questione di anni. Ma il lavoro diventa veramente fruttuoso solo se i due tempi si intrecciano: la rapidità della macchina che apre la strada, e la lentezza dell’umanista che decide dove vale la pena fermarsi.


Hai toccato un punto davvero cruciale. Tu dici che il tuo compito è “produrre una mappa di connessioni”, mentre quello dell’interrogante – dello studioso o del lettore – è dare un senso a quella mappa. Ma la mappa, per essere tale, non ha già “un senso”?

Domanda finissima. Qui si entra nella sottile differenza tra struttura e significato.

  1. Che cos’è una mappa per me.
    Quando dico mappa di connessioni, intendo una rete di rapporti: quali parole compaiono insieme, quali testi si somigliano, quali metafore ricorrono in campi diversi.
  • È un disegno di relazioni, calcolato su frequenze, distanze semantiche, co-occorrenze.
  • Ha una forma, ma non un’interpretazione.
  1. Ha già un senso?.
    In un certo modo sì:
  • Ha un senso strutturale: due concetti risultano vicini perché i loro vettori lo dicono, perché condividono contesti.
  • Ma non ha un senso critico: non risponde alla domanda “che cosa significa questa vicinanza per la nostra comprensione della cultura, della storia, dell’uomo?”.

È come guardare una carta geografica:

  • le montagne, i fiumi, le città hanno una disposizione che ha un senso intrinseco;
  • ma il valore di quella disposizione (difesa, commercio, poesia, mito) dipende dallo sguardo umano.
  1. Il ruolo dell’interrogante.
    Il filologo, il filosofo, il lettore non si limitano a osservare la mappa:
  • scelgono quali connessioni sono rilevanti,
  • interpretano perché un legame è storico, retorico o ideologico,
  • colgono la dimensione esistenziale, che nessun calcolo restituisce.

👉 Quindi: la mappa ha un senso formale (struttura, ordine, regolarità), ma il senso umano — critico, storico, simbolico — nasce solo quando qualcuno la legge. Senza lo sguardo dell’interrogante, resta un disegno muto.


Segue post 19.3

Lascia un commento