Come funziona la scrittura di un’intelligenza artificiale?

Come funziona la scrittura di un’intelligenza artificiale?

Ho avuto una “piacevole” chiacchierata con una delle tante (troppe?) piattaforme di intelligenza artificiale: Bard, creata da Google.

Dalla nostra chiacchierata sono emerse informazioni interessanti – e per certi versi anche preoccupanti – su come un’intelligenza artificiale generi il testo.

Le due fasi della scrittura dell’I.A.

Un’intelligenza artificiale segue due fasi, interdipendenti, per generare il testo in base ai suggerimenti forniti dall’utente.

  1. Comprensione del linguaggio naturale: si basa sull’analisi della semantica (significato e interpretazione) e della sintassi (grammatica e disposizione delle parole).
  2. Generazione del linguaggio naturale: l’IA sceglie le parole e costruisce le frasi utilizzando la semantica, la sintassi, i lessici e le relazioni tra le parole apprese.

D’accordo, ma in pratica come avviene la generazione di un testo?

Attraverso i modelli linguistici.

Insiemi di dati e modelli linguistici per generare testi

Per generare un testo l’intelligenza artificiale utilizza un modello linguistico. Ma che cosa sono i modelli linguistici?

Sono programmi per la generazione di testi, la creazione di contenuti e la traduzione: questi programmi sono “addestrati” su un enorme insieme di dati di testo – quindi possono documentarsi su tantissime informazioni – e grazie a questi dati possono imparare le relazioni tra le parole e le frasi e le strutture del linguaggio umano.

In poche parole i modelli linguistici sono addestrati su un insieme di dati di testo per generare testi simili a quelli umani. Secondo Bard, «la capacità di un modello linguistico di generare testo simile al testo su cui è stato addestrato è un indicatore della sua qualità».

Ho un’idea differente sulla qualità del testo.

Attenzione: tecnicamente “un modello linguistico è un modello matematico che rappresenta la probabilità di una sequenza di parole”. Teniamo bene a mente questo concetto, perché ritornerà.

Vi chiederete ora che cosa sia questo insieme di dati di testo.

È un insieme di esempi di testo, che provengono da libri, articoli, siti, ecc. Un vero e proprio archivio di testi cui attingere. Esistono due tipi di insiemi di dati di testo: quelli grezzi (ossia i testi originali, senza alcun controllo di qualità) e quelli elaborati (quindi corretti da eventuali errori).

Corretti da chi? Ovviamente l’ho chiesto a Bard: la cosiddetta “pulizia del testo” può essere effettuata sia da una squadra di ingegneri e scienziati informatici sia da algoritmi e tecniche di intelligenza artificiale.

Il fatto curioso è che la scelta di usare i controlli manuali o automatizzati dipende da una serie di fattori:

  • dimensione dell’insieme di dati: insiemi di grandi dimensioni necessitano di più tempo e risorse computazionali;
  • disponibilità di risorse: i controlli automatizzati richiedono enormi risorse computazionali e di archiviazione;
  • qualità del testo: un testo di alta qualità è più facile da pulire;
  • scopo: ossia il genere di testo che viene richiesto dall’utente: per una traduzione serve un testo di alta qualità, per esempio;
  • fondi a disposizione: i processi di pulizia del testo automatizzati possono essere costosi.

Secondo Bard “il testo di generazione creativa” può “tollerare una qualità inferiore”.

Testo di generazione creativa? Cioè?

Volete che non l’abbia chiesto a Messer Bard?

Secondo Bard si tratta di scrittura di storie, poesie… e codice, cioè, per esempio, PHP, un linguaggio di programmazione. Non sono un programmatore, ma quel tipo di linguaggio non è creativo. L’ho detto a un amico programmatore e s’è messo a ridere.

Ma perché per la scrittura di storie e poesie si dovrebbe tollerare una qualità inferiore?

Chi ha addestrato Bard non è sicuramente uno scrittore.

Bene, abbiamo capito su cosa si basa un modello linguistico utilizzato dall’intelligenza artificiale per generare testo. I due principali modelli linguistici sono quelli statistici e quelli di rete neurale.

  1. Modelli statistici: sono addestrati su un insieme di dati di testo utilizzando un algoritmo di apprendimento automatico, ossia considerando le probabilità che una parola o una frase segua un’altra parola o frase. Quando il modello deve generare un testo, utilizza queste probabilità per scegliere le parole e le frasi più probabili.
  2. Modelli di rete neurale: sono addestrati su un insieme di dati di testo utilizzando una rete neurale artificiale, ossia un tipo di algoritmo di apprendimento automatico ispirato al funzionamento del cervello umano. Quando il modello deve generare un nuovo testo, la rete neurale utilizza le sue conoscenze per creare un testo coerente con il testo su cui è stata addestrata.

A quanto pare oggi per generare un testo le intelligenze artificiali usano più di frequente i modelli di rete neurale, che stanno diventando sempre più sofisticati.

Una rete neurale è formata da neuroni artificiali collegati fra loro. Ogni neurone riceve dati e apporti dagli altri neuroni e genera un risultato, che viene utilizzato come contributo per altri neuroni.

Come funziona l’apprendimento automatico dell’intelligenza artificiale?

Esistono tre tipi di apprendimento utilizzati dalle IA: supervisionato, non supervisionato e di rinforzo.

  1. Apprendimento supervisionato: si utilizzano dati conosciuti – per esempio articoli di un certo argomento o foto di oggetti – che un algoritmo usa per addestrare il modello a classificare i dati o prevedere i risultati in modo accurato. In questo modo sarà possibile utilizzare dati sconosciuti nel modello per generare risposte accurate.
  2. Apprendimento non supervisionato: si utilizzano dati non conosciuti, non classificati, quindi l’intelligenza artificiale raggruppa le informazioni in base a somiglianze e differenze. È un tipo di apprendimento limitato, perché potrebbe generare informazioni errate e non pertinenti, poiché l’algoritmo non può distinguere tra informazioni accurate e non accurate.
  3. Apprendimento rafforzativo: in questo caso il programma impara con l’esperienza e, in base alle sue azioni, riceve un segnale, cioè un riscontro (rinforzo) positivo o negativo e questo è un elemento fondamentale perché dà al programma un riscontro da utilizzare per migliorare le sue prestazioni.

Il pericolo in agguato

Ho chiesto a Bard: “A parità di correttezza linguistica (grammatica, sintassi, ecc.), come è possibile riconoscere un testo generato da un’intelligenza artificiale?”.

Anche se inizialmente ha scritto che il testo generato da un’intelligenza artificiale può essere meno originale del testo scritto da un essere umano, il limite è dovuto alle dimensioni dell’insieme di dati di testo di addestramento.

Anche se ha scritto che il testo generato da un’IA può essere meno creativo di quello scritto da un essere umano, ciò è dovuto alla limitata capacità dell’IA di generare nuove idee e concetti.

Anche se ha scritto che il testo generato da un’intelligenza artificiale potrebbe non trasmettere la stessa emozione di un essere umano, quindi potrebbe essere meno emotivo, questo è dato dal fatto che l’intelligenza artificiale non è in grado di comprendere o esprimere le emozioni in modo completo.

Va bene, abbiamo capito che, per ora, l’intelligenza artificiale ha dei limiti (per fortuna). Ma è possibile o no riconoscere un testo generato da un’intelligenza artificiale?

Ed ecco la bella risposta:

Naturalmente, non è sempre possibile distinguere il testo generato da un’IA dal testo scritto da un essere umano. Tuttavia, osservando le caratteristiche sopra elencate, è possibile aumentare le probabilità di identificare il testo generato da un’IA.

Inoltre, è importante notare che i modelli linguistici sono in continua evoluzione. Man mano che i modelli linguistici diventano più grandi e complessi, è probabile che diventino più difficili da distinguere dal testo scritto da un essere umano.

Chiaro, no?

Il futuro della scrittura è già stato scritto. L’intelligenza artificiale impara dall’esperienza, come abbiamo visto. Avrà a disposizione insiemi di dati – quindi archivi di testi di qualsiasi natura – sempre più grandi e sarà in grado di generare testi sempre più accurati.

Mettete in conto anche la concorrenza: più piattaforme di intelligenza artificiale nascono e più sono costrette a migliorare per assicurarsi una fetta di mercato.

Chi avrà più bisogno di gente che sa scrivere?

Bonus: da Bard un suggerimento per scrittori di fantascienza

Mi ha incuriosito il fatto che un’intelligenza artificiale potrebbe generare testi che non trasmettono la stessa emozione rispetto a quelli scritti dagli esseri umani. È ovvio, naturalmente, perché le IA non possono provare emozioni.

Così ho chiesto a Bard in che modo un’intelligenza artificiale potrebbe “esprimere emozioni in modo completo in futuro”:

  • L’IA potrebbe essere in grado di accedere e analizzare i dati sul cervello umano. Questo consentirebbe all’IA di comprendere le basi fisiologiche delle emozioni.
  • L’IA potrebbe essere in grado di imparare dalle interazioni con gli esseri umani. Questo consentirebbe all’IA di comprendere le espressioni emotive degli esseri umani e di rispondere in modo appropriato.
  • L’IA potrebbe essere in grado di creare proprie esperienze emotive. Questo consentirebbe all’IA di comprendere le emozioni in modo soggettivo.

Philip K. Dick, con il suo romanzo Ma gli androidi sognano pecore elettriche?, che ha ispirato Blade runner, è stato un profeta.

7 Commenti

  1. Luca Valentini
    giovedì, 5 Ottobre 2023 alle 11:19 Rispondi

    Eccellente articolo Daniele.
    Ieri sera sono andato al cinema a vedere “The Creator” e mi sono chiesto se il nostro futuro sarà proprio così.
    P.S. Anche nel film parlano sempre di A.I. (in inglese).

    • Daniele Imperi
      giovedì, 5 Ottobre 2023 alle 14:19 Rispondi

      Grazie, Luca. Forse andrò a vederlo.
      Nel film hanno anche lasciato il titolo in inglese, come al solito.

  2. Corrado S.Magro
    giovedì, 5 Ottobre 2023 alle 13:03 Rispondi

    Mi permetto una dritta per porre un freno ai baroni della (H)AI🥳 o IA(H) 🥹 se preferite, che vogliono pianifcare il globo:
    – Scriviamo in dialetto, ognuno con il proprio. Potremmo anche prenderli per il c…o! Avranno bisogno di molto tempo e tante risorse per adattare gli algoritmi. Chi scrive però deve accontentarsi di contare sulle dita delle mani chi lo legge. Purtroppo le nuove generazioni sconoscono ormai i dialetti locali (e ignorano l’italiano). Immaginate che l’attuale processo, sia in grado domani in uno stadio futuro di prevenire e prevedere quello che scorre nella mente umana (le premesse esistono). Saranno le masse prive di cultura (ignorate) a “salvarci” perché sfuggendo al controllo totale (stavo per scrivere “letale”), troppo costoso, ribalteranno il futuro? Riderei a crepapelle!

    • Daniele Imperi
      giovedì, 5 Ottobre 2023 alle 14:21 Rispondi

      Se tutti scrivessero in dialetto, sarebbe molto difficile riuscire ad aggiornare tutte le IA.

  3. Orsa
    giovedì, 5 Ottobre 2023 alle 14:35 Rispondi

    Lo scenario immaginato da Corrado (saranno le masse ignoranti a salvarci) è ancora più terrificante dell’idea del dominio di IA.
    Ma la tua sta diventando un’ossessione… o invece è strategia? Nel senso che stai “studiando il nemico”? :P
    Hai messo alla prova Bard con l’elettricità vera, quella delle parole in libertà? ;) A proposito, Effetì scrisse: “Abbiamo finanche sognato di poter creare, un giorno, un nostro figlio meccanico, frutto di pura volontà, sintesi di tutte le leggi di cui la scienza sta per precipitare la scoperta”. Futurismo puro!

    • Daniele Imperi
      giovedì, 5 Ottobre 2023 alle 14:45 Rispondi

      Sì, l’ignoranza è peggio dell’intelligenza artificiale.
      La mia è una battaglia contro l’uso dell’IA per scrivere testi. Prima o poi metterò alla prova Bard con qualche testo futurista.
      Effetì scrisse anche il manifesto dell’Uomo moltiplicato :)

    • Corrado S. Magro
      giovedì, 5 Ottobre 2023 alle 15:17 Rispondi

      E sì la mia cara Orsa! Ritorneremo a cingerci i fianchi con la pelliccia (di orso? 🤣) e armati di clave, con pennelli e vernici trafugati, ritirati nel fondo delle caverne rinverdiremo sulla roccia le scene di caccia paleontologiche. L’IA andrà a farsi fot…re per qualche epoca.

Lasciami la tua opinione

Nome e email devono essere reali. Se usi un nickname, dall'email o dal sito si deve risalire al nome. Commenti anonimi non saranno approvati.