Immagina di chiedere a un modello di AI di completare questa frase: "Il gatto saltò sul tavolo e...". Se la temperatura è molto bassa, la risposta sarà quasi sempre "rovesciò il vaso". Se la temperatura è molto alta, potrebbe ricevere "trasformò in un astronauta". La temperatura non descrive il calore fisico del processore, ma governa come il modello sceglie la parola successiva tra tutte le possibilità disponibili.

All'interno di ogni modello di linguaggio esiste un processo matematico che assegna a ogni parola una probabilità. Quando il modello deve scegliere quale parola scrivere dopo "il gatto saltò sul tavolo e", il sistema calcola quanto sia probabile ogni parola nel contesto. "Rovesciò" avrà una probabilità alta, "trasformò" una probabilità bassa, "cantò" una probabilità ancora più bassa.

La temperatura interviene in questo momento di scelta. È un numero, di solito compreso tra 0 e 2, che modifica queste probabilità prima che il modello scelga.

Come la temperatura cambia le probabilità

Con temperatura 0, il modello ignora tutto e sceglie sempre la parola più probabile. È come se mettessi il dito sulla parola che ha il punteggio più alto e dicessi: solo questa. Il risultato è deterministico, prevedibile, affidabile. Chiedi due volte la stessa cosa, ottieni la stessa risposta.

Con temperatura 1 (il valore standard per molti modelli), le probabilità rimangono come sono. Se "rovesciò" ha il 70% di probabilità e "trasformò" il 15%, il modello sceglierà secondo queste proporzioni. Ottieni variabilità, ma vincolata alla statistica del testo di addestramento.

Con temperatura 2, il modello appiattisce le differenze tra le probabilità. Tutte le parole diventano più equiprobabili, incluse quelle che normalmente sarebbero molto improbabili. Il modello inizia a fare salti creativi, a volte geniali, a volte assurdi. Puoi ottenere risposte molto diverse ogni volta.

Quando scegliere quale temperatura

Se stai usando un'AI per verificare fatti, calcolare numeri o scrivere istruzioni tecniche, abbassa la temperatura a 0 o 0.3. Vuoi che il modello sia coerente, preciso, affidabile. Una risposta uguale ogni volta è quello che serve.

Se vuoi che l'AI generi storie, poesia, suggerimenti creativi o brainstorming di idee, sali a 0.8 o 1.2. La variabilità è la risorsa. Ogni run produce spunti diversi da cui scegliere.

Se chiedi idee radicalmente nuove o esperimenti artistici, puoi provare fino a 1.5 o 2. Il rischio è che il modello dica cose incoerenti o che non abbiano senso, ma a volte è quello che cerchi: qualcosa che rompa gli schemi.

Un confronto pratico

Chiedi a un modello: "Suggerisci un nome per un ristorante di pesce."

Con temperatura 0: "Pesce Fresco". "Pesce Fresco". "Pesce Fresco" ogni volta.

Con temperatura 1: "Pesce Fresco", poi "Il Faro del Porto", poi "Scogliera Marina", poi "Pesce Fresco" di nuovo.

Con temperatura 1.5: "Pesce Fresco", poi "Il Sussurro dei Granchi Notturni", poi "Tentacoli e Stelle", poi "La Sinfonia dell'Oceano in Rilievo".

Il modello è lo stesso. Non cambia il cervello. Cambia solo come sceglie tra le opzioni che già conosce.

Temperatura non è learning

Un'avvertenza importante: la temperatura non influenza come il modello impara. Durante l'addestramento, i parametri che contano sono gli algoritmi di ottimizzazione, il tasso di apprendimento, la qualità dei dati. La temperatura interviene solo quando il modello è già finito e inizia a generare risposte.

È un controllo del momento di utilizzo, non di costruzione. Se il modello non sa qualcosa durante l'addestramento, alzare la temperatura non glielo insegnerà. Al contrario, gli permetterà solo di indovinare più liberamente.

Le eccezioni e i limiti

Alcuni modelli interpretano la temperatura diversamente. In alcuni sistemi, lo 0 è assolutamente fisso, in altri è quasi fisso ma con micro-variabilità. In sistemi molto grandi, la temperatura potrebbe interagire con altri parametri come il top-p o il top-k, che restringono ulteriormente le scelte.

La temperatura è uno strumento utile, ma semplice. Non resolve i limiti del modello, non lo rende più intelligente, non lo corregge. Se il modello è addestrato su dati di scarsa qualità, la temperatura lo rende solo più o meno randomico su quella base scarsa.

Usarla bene significa riconoscere cosa stai cercando: precisione e affidabilità, oppure diversità e esplorazione. Poi scegli il numero che serve. Non è scienza, è configurazione.