C'è una parola tecnica che pochi conoscono ma che sta dietro a una quantità impressionante di cose che usiamo ogni giorno: embedding. Sta dietro alla ricerca per somiglianza nelle gallerie fotografiche, dietro alle raccomandazioni di Netflix e Spotify, dietro al funzionamento profondo di ChatGPT. Vale la pena capirla, perché ti permette di vedere "sotto" molte tecnologie che usi senza pensarci.

Cosa è un embedding

Un embedding è una rappresentazione matematica di qualcosa — una parola, una foto, un suono, un libro intero — sotto forma di una lunga lista di numeri. Tipicamente da 500 a 4000 numeri. Per il computer, ogni cosa nel mondo si trasforma in una sequenza di numeri di questa lunghezza. Stesso meccanismo per tutto.

La cosa magica è che queste sequenze di numeri sono fatte in modo tale che cose simili abbiano numeri simili. La parola "cane" e la parola "cucciolo" hanno sequenze numeriche molto vicine. Una foto di gatto e una foto di tigre hanno sequenze numeriche più vicine di una foto di gatto e una foto di automobile. La canzone "Stairway to Heaven" e la canzone "Hotel California" hanno embedding più simili rispetto a "Stairway to Heaven" e una sinfonia di Mozart.

Perché è importante

Una volta che hai trasformato tutto in numeri (cioè in embedding), puoi confrontare qualsiasi cosa con qualsiasi altra cosa usando una semplice formula matematica. È quello che hanno scoperto i ricercatori AI verso il 2013-2015 e che ha cambiato tutto il settore.

Esempi di cose che diventano possibili grazie agli embedding:

Un esempio per capire

Prendi tre parole: "re", "regina", "uomo". Trasformiamo in embedding (immagina sequenze di 100 numeri). Cose sorprendenti che si possono fare:

Embedding("re") − Embedding("uomo") + Embedding("donna") = Embedding più vicino a "regina"

Cioè, la matematica degli embedding "capisce" che il rapporto tra re e uomo è simile al rapporto tra regina e donna. Senza che nessuno lo abbia spiegato. Questa è una delle scoperte più sorprendenti dell'AI moderna, e tutto si basa su embedding.

Dove li hai già incontrati senza saperlo

Praticamente ovunque:

Cosa significa per te

Conoscere la parola "embedding" cambia il tuo modo di leggere il mondo digitale. Quando un servizio sembra capirti "per magia", quasi sempre c'è un embedding sotto. Quando senti parlare di "ricerca semantica" o "ricerca per significato", sono embedding. Quando un'app trova somiglianze tra cose senza tag espliciti, sono embedding.

Non sono magia. Sono matematica vettoriale applicata su scala enorme. E sono, in un certo senso, il mattone fondamentale di tutta l'AI moderna.