Se usi ChatGPT, Claude o altri assistenti per compiti specifici, avrai notato una cosa: le prime risposte seguono perfettamente le tue istruzioni, poi a un certo punto smettono. Non e magia. E il modo in cui questi sistemi gestiscono la memoria della conversazione.

Quando dai un comando a un assistente AI, stai inserendo quello che si chiama un "prompt di sistema". Funziona bene all inizio, ma man mano che la conversazione si allunga, il modello assegna sempre meno peso a quelle istruzioni iniziali. Dopo una ventina di messaggi, il contesto puo diventare talmente denso che le tue regole originali quasi scompaiono dal radar dell AI.

Perche succede dopo venti messaggi

I modelli di linguaggio lavorano con una finestra di contesto: uno spazio di memoria dove conservano tutti i messaggi precedenti della conversazione. Piu messaggi accumuli, piu quella finestra si riempie. A un certo punto non c e piu spazio, e il sistema inizia a scartare informazioni che ritiene meno rilevanti. Le tue istruzioni iniziali sono spesso le prime a finire nel cestino.

Non accade sempre esattamente a venti messaggi, dipende dalla lunghezza di ogni risposta e da quanti token vengono utilizzati. Ma e una soglia reale. I vecchi modelli avevano finestre piu strette, quindi il problema era piu evidente. I nuovi modelli hanno finestre piu grandi, ma il fenomeno persiste.

Come rinforzare le istruzioni durante la conversazione

La soluzione piu diretta e ripetere le regole a metà conversazione. Non serve copiare l intero prompt: basta un richiamo. Se avevi detto all AI "scrivi sempre in forma concisa", dopo una decina di messaggi puoi aggiungere "ricordati che preferisco risposte brevi". Questo riporta le tue istruzioni in primo piano nella memoria del modello.

Un metodo piu sofisticato e riformulare le istruzioni come regole ricorrenti dentro i messaggi stessi. Invece di dire all inizio "parlami sempre come un insegnante di matematica", puoi inserire frasi come "seguendo la prospettiva di un insegnante di matematica, come spiegheresti questo?" in ogni domanda. In questo modo, il contesto si autoriferisce costantemente alle tue preferenze.

La tecnica del ringrosso progressivo

Alcuni utenti esperti usano quello che potremmo chiamare "ringrosso progressivo": aggiungono una riga nascosta di istruzioni non visibile (o in grassetto, o come nota) ogni cinque messaggi circa. Non disturba la lettura, ma mantiene costantemente vivo il vincolo originale nella finestra di contesto.

Un altra tattica e usare un formato strutturato. Se dici all AI "rispondi sempre con questa struttura: Fatto, Contesto, Implicazione", quella struttura rimane una guida stabile perche la richiami implicitamente ad ogni risposta che dai. Non e una ripetizione noia della regola originale, ma una pratica ricorrente che la mantiene attiva.

Che cosa cambia tra i modelli

I modelli con contesto piu ampio soffrono meno di questo problema. GPT-4 Turbo o Claude 3 gestiscono conversazioni lunghe meglio di GPT-3.5. Ma neppure questi sono immuni. La qualita del tuo prompt iniziale conta: istruzioni precise e concise hanno meno probabilita di venire dimenticate rispetto a istruzioni vaghe o lunghe.

La vera soluzione: usa i prompt salvati

Molti assistenti oggi permettono di salvare i tuoi prompt personalizzati in forma di istruzioni di sistema ricorrenti. Se la piattaforma lo consente, questo e il metodo piu stabile. Non dovrai ricordare le tue regole durante la conversazione: il sistema le mantiene come fondamenta della conversazione stessa, non come dato che puo sparire.

Se stai costruendo un workflow con un assistente AI per un compito ricorrente, investi tempo nel creare un sistema di prompt ben strutturato all inizio, poi usa sempre quello stesso contesto. Non inventare nuove conversazioni ogni volta: riusa lo stesso setup. E il metodo piu affidabile per mantenere le regole attive.

Una questione aperta

Questo problema riflette una limitazione ancora vera dei modelli attuali, anche se sempre meno evidente. Non e un bug, e una caratteristica del loro modo di funzionare. Capirla non risolve completamente il problema, ma aiuta a costruire meglio le tue interazioni con l IA, adattandoti al modo in cui questi sistemi gestiscono la memoria.

Chi usa intensivamente gli assistenti AI sa bene che le conversazioni lunghe richiedono una certa strategia. Non e una frustrante, e semplicemente il modo in cui queste tecnologie funzionano oggi. Le piattaforme stanno migliorando, ma per ora, sapere come rinforzare le tue istruzioni rimane una competenza utile.