Strawberry è arrivato, seppur con un altro nome: OpenAI ha infatti annunciato il lancio di due nuovi modelli di intelligenza artificiale, denominati OpenAI o1 (preview) e o1-mini, che promettono di rivoluzionare il campo dell’AI generativa. Questi modelli, attesi da tempo, rappresentano un significativo passo avanti rispetto alle versioni precedenti, grazie a un approccio innovativo che simula un processo di ‘riflessione’ prima di fornire una risposta.
I temi trattati all’interno dell’articolo
Come funzionano i nuovi modelli?
A differenza dei modelli di linguaggio tradizionali, che generano risposte attraverso una ‘semplice’ previsione sequenziale di parole (token), i nuovi modelli o1 integrano diverse tecnologie avanzate. In particolare, i modelli ‘ragionano’ step-by-step e si prendono del tempo per rispondere alle domande dell’utente.
Il cuore di questo nuovo sistema è un algoritmo di apprendimento per rinforzo su larga scala. Questo metodo insegna al modello a ‘pensare’ in modo produttivo, utilizzando una tecnica chiamata “chain of thought” (catena di pensiero). Durante l’addestramento, il modello impara a scomporre problemi complessi in passaggi più semplici, a riconoscere e correggere i propri errori e a cambiare approccio quando una strategia non funziona.
Un aspetto cruciale di questi modelli è la loro capacità di migliorare le prestazioni dedicando più tempo al ‘pensiero’ durante l’esecuzione dei compiti. Questo processo simula in qualche modo il ragionamento umano, permettendo al modello di affrontare problemi complessi con una profondità e una flessibilità senza precedenti.
Prestazioni che battono la concorrenza
I risultati di questo approccio sono sorprendenti: o1 ha dimostrato prestazioni eccezionali in una vasta gamma di compiti, dall’89° percentile nelle competizioni di programmazione Codeforces, al superamento dell’accuratezza di livello PhD in benchmark di fisica, biologia e chimica.
Questi risultati evidenziano come il nuovo approccio al ‘ragionamento’ stia aprendo nuove frontiere nelle capacità dell’intelligenza artificiale, avvicinandola sempre più alle capacità cognitive umane in alcuni ambiti specifici.
Disponibilità Immediata
Una notizia entusiasmante per gli sviluppatori e gli appassionati di AI è che questi modelli (nelle versioni preview e mini) sono già disponibili sia attraverso ChatGPT (Plus e Team) che tramite API, permettendo un’implementazione immediata in vari progetti e applicazioni.
Ora non resta che attendere un’eventuale ulteriore evoluzione dei modelli di OpenAI, destinati a sfociare in una versione ancora più avanzata, chiamata internamente Orion. Ciò che renderebbe speciale il la prossima famiglia di modelli – come anticipato a fine agosto – è un dataset di training formato da dati sintetici generati dallo stesso o1. Ciò dovrebbe permettere di ridurre le allucinazioni e aumentare l’affidabilità dell’AI.
Ulteriori informazioni sul sito ufficiale di OpenAI.