Si legge dappertutto: «il nuovo modello di OpenAI», «Anthropic rilascia un modello più potente», «quale modello scegliere». Compare la parola modello almeno cinque volte ogni articolo sull'AI. E quasi nessuno spiega cosa sia. Sembra una di quelle parole tecniche che gli addetti ai lavori usano per non dire «programma», ma c'è di più. Vale la pena capirlo, perché spiega molte cose su come funziona tutto questo mondo.
La definizione semplice
Un modello, nel linguaggio dell'AI, è un enorme calcolatore di probabilità. Più precisamente, è una rete neurale — un programma matematico — che è stato addestrato a indovinare quale sia la parola più probabile da scrivere dopo una sequenza di parole. Tutto qui. Tutto il resto, le risposte intelligenti, le conversazioni complesse, persino la sensazione che stia ragionando, nasce da questa abilità di indovinare la parola successiva.
Da dove vengono
Un modello AI si "fa" così. Si prendono miliardi di pagine di testo da internet (Wikipedia, libri, articoli, codice, conversazioni). Si fa girare un programma matematico per settimane su questi testi, dicendo: «qui c'è una parola coperta, indovina quale». Il programma sbaglia all'inizio, poi corregge i suoi parametri interni, indovina meglio, sbaglia, corregge, milioni di volte. Alla fine, ha imparato a indovinare la parola successiva con un'accuratezza incredibile. Quel programma cristallizzato, con tutti i suoi miliardi di parametri sistemati al posto giusto, è il modello.
Perché esistono modelli diversi
Tre motivi:
Aziende diverse. OpenAI fa i modelli GPT. Anthropic fa i modelli Claude. Google fa i modelli Gemini. Meta fa i modelli Llama. Mistral fa modelli francesi. Ognuno usa testi diversi per addestrarli, architetture leggermente diverse, regole etiche diverse. Risultato: comportamenti leggermente diversi.
Dimensioni diverse. Un modello grande è più intelligente ma più lento e costoso. Un modello piccolo è veloce ed economico ma fa errori più banali. Le aziende rilasciano modelli di varie taglie: Claude Haiku (piccolo), Sonnet (medio), Opus (grande); GPT-4o-mini, GPT-4o, GPT-5. Scegli in base a cosa ti serve.
Generazioni diverse. Ogni anno escono modelli nuovi, addestrati meglio, con più dati, più potenti. GPT-3 era impressionante nel 2022. GPT-5, di tre anni dopo, è un altro pianeta. È come confrontare l'iPhone 6 con l'iPhone 16: stessa famiglia, distanza siderale.
Come scegliere il modello giusto
Per uso quotidiano normale (scrivere email, fare domande, organizzare cose) qualsiasi modello recente di Claude, ChatGPT o Gemini va benissimo. La differenza tra loro è inferiore alla differenza tra usarli o non usarli. Per lavori specifici — coding complesso, analisi di documenti lunghi, scrittura creativa — vale la pena provarne due o tre e vedere quale ti suona meglio.
Una metafora che aiuta
Pensa al modello come a un cervello universitario. Tutto quello che ha letto durante l'addestramento è la sua "università". Quando gli fai una domanda, lui non cerca su Google: pesca dalla sua memoria interna (i miliardi di parametri) cosa rispondere. Per questo i modelli hanno una data di knowledge cutoff — una data oltre la quale non sanno più niente. Sono congelati al momento in cui l'addestramento è terminato.
