Site icon visionedigitale.it

Gpt-oss, perché i nuovi modelli aperti di OpenAI sono una svolta importante per l’azienda

Gpt-oss, perché i nuovi modelli aperti di OpenAI sono una svolta importante per l'azienda

OpenAI ha lanciato i suoi primi modelli open-weight in oltre cinque anni. I due sistemi di intelligenza artificiale, gpt-oss-120b e gpt-oss-20b, possono essere utilizzati localmente sui dispositivi consumer e messi a punto per scopi specifici. Per la società si tratta di una svolta: se fin qui si è concentrata su sistemi proprietari, ora OpenAI sembra decisa a virare su una serie più ampia e aperta di modelli AI per i suoi utenti.

Siamo entusiasti di mettere a disposizione del mondo questo modello, frutto di miliardi di dollari di ricerca, per portare l’AI nelle mani del maggior numero possibile di persone“, ha dichiarato l’amministratore delegato di OpenAI, Sam Altman, in un comunicato inviato via email. Sia gpt-oss-120b che gpt-oss-20b sono ufficialmente disponibili per il download gratuito su Hugging Face, una popolare piattaforma AI. Prima dei nuovi sistemi, l’ultimo modello open-weight di OpenAI era stato GPT-2, nel 2019.

Cos’è un modello open-weight

L’elemento che distingue un modello open-weight da quelli tradizionali è il fatto che i suoi “pesi” sono disponibili al pubblico, il che significa che chiunque può analizzare i parametri interni del sistema e farsi un’idea di come elabora le informazioni. Il cofondatore di OpenAI Greg Brockman non ritiene che i nuovi modelli possano rivelarsi deleteri per i servizi a pagamento dell’azienda (come l’interfaccia di programmazione delle applicazioni, utilizzata da molti sviluppatori): al contrario, li considera complementari all’offerta esistente: “I modelli aperti hanno una serie di punti di forza molto diversi“, ha detto Brockman in un briefing con la stampa. A differenza di ChatGPT, i modelli gpt-oss possono essere utilizzati anche senza una connessione a internet e in presenza di un firewall.

Cosa possono fare i nuovi gpt-oss

Sia gpt-oss-120b che gpt-oss-20b utilizzano il cosiddetto ragionamento chain-of-thought (letteralmente, catena di pensieri), che OpenAI ha introdotto per la prima volta con il modello o1 lo scorso autunno. Anziché limitarsi a fornire un risultato agli utenti, grazie a questo approccio gli strumenti di intelligenza artificiale generativa eseguono più passaggi per rispondere a una richiesta. Questi modelli non sono multimodali (producono risposte solo testuali), ma possono navigare sul web, richiamare altri modelli basati sul cloud per farsi aiutare a svolgere compiti, eseguire comandi e navigare all’interno di un software come un agente AI. Il più piccolo dei due sistemi appena lanciati da OpenAI, gpt-oss-20b, è abbastanza compatto da poter essere eseguito localmente su un dispositivo consumer, purché abbia più di 16 gb di memoria.

I due nuovi modelli di OpenAI sono disponibili con la licenza Apache 2.0, che consente tra le altre cose l’utilizzo per scopi commerciali e la ridistribuzione. Apache 2.0 è una scelta popolare per le AI aperte ed è la licenza usata anche dai sistemi open-weight di Alibaba e Mistral.

OpenAI aveva annunciato il lancio a marzo, salvo poi ritardarlo per poter eseguire ulteriori test di sicurezza. Un modello open-weight è potenzialmente più pericoloso rispetto a una versione chiusa, perché di fatto elimina le barriere all’uso e permette a chiunque di mettere a punto versioni da sfruttare per scopi non previsti.

Exit mobile version