OpenAI vince l’oro alle Olimpiadi della matematica

Facebook
WhatsApp
Twitter
LinkedIn
Telegram

C’è anche un grande modello di linguaggio (Llm) sperimentale di OpenAI nella piccola fetta del 10% dei partecipanti all’ultima edizione delle Olimpiadi Internazionali di Matematica che è stata in grado di raggiungere l’oro. Il nuovo Llm ancora non diffuso in modo pubblico ha dimostrato tutta la sua abilità nel ragionamento complesso riuscendo a risolvere con successo cinque dei sei complicati problemi proposti, un piccolo antipasto delle sue potenzialità ancora in parte da esplorare e mettere alla prova.

La notizia è stata diffusa da Alexander Wei, un ricercatore che a OpenAI si occupa proprio dello sviluppo dei grandi modelli di linguaggio con abilità di ragionamento avanzato. Secondo quanto raccontato con un post su X, il modello sperimentale è stato in grado di risolvere cinque problemi di algebra su sei proposti ai partecipanti dell’ultima edizione delle Olimpiadi Internazionali di Matematica. Il punteggio finale per l’AI è stato di 35 su 42, qualcosa che soltanto 67 umani su 630 sono riusciti a ottenere, quindi poco più del 10%.

I partecipanti che ottengono i punteggi più alti vengono premiati con medaglie d’oro, d’argento e di bronzo, in base a fasce di punteggio. Il risultato è molto più significativo di quanto sembrerebbe, perché i quesiti di algebra come quelli delle Olimpiadi Internazionali della Matematica possono mettere a dura prova le AI, che sono efficienti nell’analisi di database e nelle azioni ripetitive, ma possono incontrare grosse difficoltà nel ragionamento complesso che richiede un approccio spesso creativo e laterale, più raffinato.

X content

This content can also be viewed on the site it originates from.

In questo modo abbiamo ottenuto un modello in grado di elaborare argomentazioni complesse e inconfutabili sul livello dei matematici umani”, ha commentato Wei su X. Il nuovo modello risolverà anche tutti i problemi degli studenti non così appassionati di matematica? Ci vorrà ancora pazienza, perché si tratta di una tecnologia sperimentale che non ha ancora nemmeno una possibile finestra di uscita per il grande pubblico. Va da sé che quando sarà diffuso non sarà un modello incentrato soltanto sulla matematica e sull’algebra, ma sfrutterà le sue capacità di ragionamento anche per molteplici altri compiti per offrire interazioni sempre più precise e coerenti per gli utenti che utilizzano gli strumenti di OpenAI.

Visite totale 1 , 1 visite oggi

Continua a leggere

Scorri verso l'alto