Nel mondo degli strumenti di intelligenza artificiale per l’editing delle immagini è successo qualcosa di insolito. Un nuovo modello, noto come “Nano banana”, ha iniziato a fare parlare di sé per le sue notevoli capacità, che gli sono valse la cima alla classifica di LMArena, una piattaforma che valuta gli llm. Martedì 26 agosto, Google ha rivelato che Nano banana è l’ultima innovazione uscita dal suo laboratorio dedicato all’AI, DeepMind, annunciandone l’integrazione sull’app di Gemini.
Che cos’è Nano banana
Tra le molte altre cose, l’AI consente di modificare le immagini semplicemente con un prompt, senza dover armeggiare con Photoshop. Google ha lanciato per la prima volta una funzionalità di editing all’interno di Gemini all’inizio di quest’anno, e il modello del colosso si è dimostrato più che all’altezza fin da subito. Ma come tutti i sistemi di intelligenza artificiale generativa, spesso i risultati di questi strumenti sono imprevedibili. Google sostiene che Nano banana (il cui nome ufficiale tecnicamente è Gemini 2.5 Flash Image) è in grado di intervenire con coerenza fin qui mai vista, ricordando i dettagli delle illustrazioni senza costringere gli utenti a sperare nel caso ogni volta che apportano una modifica.
Cosa si può fare con l’ultima AI di Google
La novità apre la strada a diversi utilizzi interessanti. Il gigante suggerisce per esempio di sfruttare il modello per modificare lo stile o l’abbigliamento di una persona ritratta in una foto. magari per vestirla come un torero o un personaggio di una sitcom degli anni Novanta, senza snaturare i tratti del soggetto in questione (anche quando si apportano cambiamenti in un secondo momento).
Ma il modello permette anche di unire più immagini da utilizzare come base per crearne una nuova. Nell’esempio mostrato da Google visibile qui sotto, due foto che raffigurano rispettivamente una donna e un cane vengono utilizzate per generare una nuova istantanea in cui l’animale domestico viene coccolato: forse il miglior uso dell’AI generativa visto finora. La funzione può essere usata anche in modi più astratti, creando praticamente qualsiasi cosa venga partorita dalla mente degli utenti (purché non violi le limitazioni del modello).
Come per gli altri sistemi AI per la generazione delle immagini di Google, i risultati di Nano banana includono sempre un watermark “AI” visibile in un angolo, oltre a una filigrana digitale SynthID invisibile che può essere rilevata anche dopo una piccola modifica.
Per chi è curioso di cimentarsi con l’ultima AI di Google, è possibile accedere a Nano banana dall’app di Gemini. Il gigante ha dichiarato che il nuovo modello sarà presto disponibile anche nell’Api di Gemini, oltre che all’interno di AI Studio e in Vertex AI per gli sviluppatori.
Questo articolo è apparso originariamente su Ars Technica.