Quando senti parlare di intelligenza artificiale, probabilmente pensi a chatbot che rispondono alle domande o a sistemi che generano immagini. Ma cosa succede dentro questi programmi? Da dove partono le loro risposte? La risposta è sorprendentemente più semplice di quel che sembra, se sai quali sono i dieci concetti che reggono tutto il meccanismo.

Primo concetto: il modello come istruzioni giganti

Un modello di intelligenza artificiale è una raccolta di istruzioni matematiche. Non è un cervello, non pensa come te. È più simile a una ricetta molto complicata: inserisci ingredienti, segui i passaggi, ottieni un risultato. Il "risultato" in questo caso è una risposta a una domanda o una descrizione di un'immagine. Queste istruzioni sono state costruite per imparare dal passato: guardare milioni di testi, milioni di immagini, milioni di esempi, e poi fare previsioni su cosa viene dopo.

Secondo concetto: l'addestramento

L'addestramento è il processo che insegna al modello. Immagina di voler insegnare a un bambino a riconoscere i cani. Non gli insegni ogni singola razza, ogni colore, ogni dimensione. Lo esponi a molti cani, e lui impara le caratteristiche comuni. I modelli di AI funzionano così: vengono "esposti" a miliardi di testi, immagini, dati. Durante questo processo, aggiustano le loro istruzioni interne per fare previsioni sempre più accurate.

Terzo concetto: i dati di addestramento

I dati sono il cibo del modello. Se un modello è addestrato su libri, articoli di giornale e pagine web italiane, imparerà la lingua italiana e il contesto culturale. Se è addestrato su immagini mediche, imparerà a riconoscere malattie nelle radiografie. La qualità e la quantità dei dati determinano quanto bene il modello farà il suo compito. Dati sbagliati producono risultati sbagliati. È banale ma cruciale.

Quarto concetto: le reti neurali

Una rete neurale è una struttura fatta di strati di "neuroni artificiali" collegati tra loro. Ogni neurone riceve un segnale, lo modifica in base a regole precise, e lo passa al neurone successivo. Niente di questo somiglia veramente a come funziona il cervello umano, nonostante il nome. È una metafora. Quel che importa è che i dati passano attraverso molti strati, e a ogni passaggio vengono trasformati. Alla fine, esce la risposta.

Quinto concetto: i parametri

Quando leggi che un modello ha "sette miliardi di parametri", non è uno sfoggio di potenza. I parametri sono i numeri che il modello regola durante l'addestramento. Sono come i pesi di una bilancia: più parametri, più sfumature il modello può imparare e rappresentare. Ma più parametri significano anche più dati necessari e più tempo di calcolo. Non è vero che più parametri uguale sempre migliore: dipende dal compito.

Sesto concetto: il prompt

Il prompt è la domanda che poni al modello. "Dimmi una ricetta di pasta" è un prompt semplice. "Scrivi un articolo di giornale sulla crisi climatica, in tono ironico, per un pubblico di teenager, lungo duecento parole" è un prompt molto specifico. La qualità del prompt influenza molto la qualità della risposta. Un modello intelligente ha bisogno di istruzioni chiare, non vaghe.

Settimo concetto: la tokenizzazione

Prima che il modello processi una parola, quella parola viene spezzata in pezzi più piccoli chiamati token. Una parola lunga potrebbe diventare tre token. "Gatto" potrebbe essere un token, "micio" un altro, ma insieme potrebbero diventare parti di token diversi. Il modello non lavora con parole intere, lavora con questi frammenti. È un passaggio tecnico che i programmatori gestiscono, ma spiega perché a volte i modelli si "confondono" su parole rare o sconosciute.

Ottavo concetto: l'attenzione

L'attenzione è un meccanismo che permette al modello di "guardare" quale parte del testo è importante per rispondere. Se la domanda è "Chi è nato prima, Mozart o Beethoven?", il modello usa l'attenzione per concentrarsi sulle parti del testo che contengono informazioni su questi due compositori, ignorando il resto. Non è consapevolezza, è una regola matematica, ma funziona.

Nono concetto: l'allucinazione

Una "allucinazione" in un modello di AI è una risposta che suona plausibile e dettagliata, ma è falsa. Il modello è stato addestrato a produrre testo coerente e fluido. A volte genera coerenza anche quando non ha dati veri su cui basarsi. Potrebbe inventare una citazione, un libro che non esiste, o un fatto storico sbagliato. Non sta mentendo intenzionalmente: sta seguendo le sue regole di generazione. Per questo non dovresti fidarti ciecamente di quello che un modello ti dice senza verificare.

Decimo concetto: il fine-tuning

Il fine-tuning è l'addestramento ulteriore su un numero minore di dati più specifici. Un modello generale potrebbe essere addestrato su miliardi di testi, poi "affinato" su migliaia di testi medici per diventare un esperto di medicina. È come imparare una lingua generale, poi specializzarsi in un dialetto regionale. Questo processo è più rapido dell'addestramento da zero ed è usato per adattare modelli generici a compiti specifici.

Mettere insieme i pezzi

Quando usi un chatbot di AI, quello che accade è questo: il tuo prompt viene tokenizzato, passa attraverso una rete neurale con miliardi di parametri, il meccanismo di attenzione decide su quali parti concentrarsi, e il modello predice quale sia il token successivo più probabile. Poi predice quello dopo. Continua fino a quando il modello non decide che la risposta è completa. Tutto questo avviene in secondi.

Nessuno di questi processi è intelligenza nel senso umano. Sono calcoli. Ma calcoli così complessi e basati su così tanti dati che producono risultati che sembranoIntelligenti. Comprendere questi dieci concetti non ti farà diventare un esperto di machine learning, ma ti permette di leggere gli articoli sulla tecnologia senza sentirti perso, e di capire quando qualcuno promette più di quello che un modello può davvero fare.