Modelli IA: 10 concetti essenziali da conoscere

Chiedi a ChatGPT di scrivere una poesia e te la genera in pochi secondi. Chiedi a un'IA di identificare una malattia da una radiografia e spesso ci prende. Eppure queste macchine non capiscono nulla di poesia o di medicina nel modo in cui lo capiamo noi. Sanno fare due cose: cercare pattern e predire il prossimo elemento in una sequenza. Tutto il resto è costruito su questi due meccanismi. Prima di usare un modello di IA, devi conoscere almeno dieci concetti che spiegano come funziona davvero.

1. L'algoritmo: il set di istruzioni

Un algoritmo è una sequenza di passi che risolve un problema. Se vuoi fare un caffè, l'algoritmo è: accendi il fuoco, metti l'acqua, aspetta, versa il caffè macinato. Per l'IA, l'algoritmo dice alla macchina come trasformare i dati in ingresso in un risultato utile. Non è intelligente di per sé: è solo un insieme di istruzioni che la macchina segue alla lettera.

2. Il dato: la materia prima

I modelli di IA mangiano dati. Tanti dati. Se dai a un modello mille foto di gatti, imparerà a riconoscere i gatti. Se gli dai un milione di frasi scritte in italiano, imparerà a generare frasi che suonano italiane. I dati sono la materia prima, il combustibile. Senza dati non c'è IA.

3. Il training: l'apprendimento ripetitivo

L'addestramento non è come imparare a leggere. Il modello non capisce, ripete. Vede un'immagine di un cane, riceve un'etichetta che dice "cane", calcola l'errore, aggiusta i suoi parametri interni, vede un'altra immagine, e così via milioni di volte. Alla fine, la macchina sa predire "cane" quando vede forme simili a quelle che ha visto prima. È pura statistica, non comprensione.

4. La rete neurale: struttura e strati

Immagina livelli di mattoncini di matematica. Il primo livello riceve i dati grezzi. Ogni mattoncino fa un calcolo semplice. I risultati passano al secondo livello, che fa altri calcoli. E così via fino all'ultimo livello, che produce la risposta finale. Più strati, più calcoli, più complessità. Non assomiglia veramente a come funziona il cervello umano, nonostante il nome.

5. Il peso e il bias: i veri parametri

Dentro ogni rete neurale ci sono milioni di numeri piccolissimi chiamati pesi e bias. Un peso dice quanto è importante una certa connessione. Un bias è un aggiustamento che permette alla rete di imparare meglio. Durante il training, questi numeri cambiano. Dopo, rimangono fissi. Sono loro che contengono tutto quello che il modello ha imparato. Un modello di IA è sostanzialmente una collezione gigantesca di numeri.

6. Il bias cognitivo: il pregiudizio nei dati

Se addestri un modello su foto di medici prese da riviste degli anni Novanta, la maggior parte sarà uomini bianchi. Quando il modello dopo vede una donna medico, potrebbe non riconoscerla correttamente. Non è colpa dell'algoritmo: è colpa dei dati. Se i tuoi dati contengono pregiudizi, il modello li impara e li amplifica. Questo bias non è intenzionale, ma è pericoloso.

7. L'overfitting: quando il modello memorizza invece di imparare

Il modello vede gli stessi dati troppo spesso e inizia a memorizzarli piuttosto che a capire il pattern generale. Immagina uno studente che ripete a memoria la risposta di una domanda senza capire il concetto. Quando gli fai una domanda leggermente diversa, fallisce. Questo è l'overfitting. Il modello funziona benissimo sui dati che ha visto, male su dati nuovi.

8. La validazione: il test della realtà

Prima di usare un modello devi controllare che funziona su dati che non ha mai visto. Dividi i tuoi dati in tre gruppi: training, validazione e test. Il modello impara dal primo, impara a stoppare quando sbaglia nel secondo, e viene valutato dal terzo. Se il modello fa bene sul training ma male sul test, hai un problema: potrebbe essere overfitting.

9. La temperatura: il grado di creatività

Nei modelli generativi come gli assistenti di scrittura, la temperatura controlla quanto il modello è conservatore o avventuroso. Una temperatura bassa significa che sceglie sempre le parole più probabili: risposte prevedibili e corrette. Una temperatura alta significa che prende rischi e sceglie parole meno probabili: risposte creative ma a volte sbagliate. Puoi regolare questo parametro per cambiare il comportamento del modello.

10. L'interpolazione e l'allucinazione: quello che il modello inventa

Un modello non sa cosa non sa. Se gli chiedi di descrivere un evento che non è nei suoi dati di training, lui non dirà "non lo so". Genererà una risposta comunque. È una cosa che genera dal nulla, coerente ma falsa. Questo si chiama allucinazione. Il modello non mente intenzionalmente: è solo che non ha altri modi di funzionare. Quando interpola, cerca di completare uno spazio tra due cose che ha visto. Quando allucina, crea qualcosa che non esiste.

Perché servono questi concetti

Capire questi dieci meccanismi non ti rende un ingegnere di IA, ma ti protegge dall'illusione. Non userai uno strumento di IA credendo che capisca davvero. Saprai che cosa sta facendo: cercando pattern nei dati che ha visto, applicando calcoli, predicendo il prossimo elemento della sequenza. Saprai perché a volte sbaglia e come limitare il danno. Saprai che la IA ha capacità molto specifiche e limiti reali. E soprattutto, saprai che nessuno tra gli sviluppatori di questi modelli sa davvero spiegarti come mai a volte funzionano così bene. Nemmeno loro capiscono completamente il meccanismo interno. Sanno solo che funziona.

Quando usi uno strumento di IA senza capire questi concetti, diventi passeggero. Quando li capisci, diventi pilota. Non puoi fare volare un aereo senza sapere cos'è la portanza, e non puoi usare bene l'IA senza sapere cos'è una rete neurale.