Google lancia TranslateGemma, traduce 55 lingue con lAI

Google ha lanciato TranslateGemma, una nuova suite di modelli di traduzione open-weight basata su Gemma 3, poche ore dopo che OpenAI ha presentato ChatGPT Translate. Una coincidenza che sa di competizione. TranslateGemma può tradurre fino a 55 lingue, dalle più diffuse come spagnolo, francese, cinese e hindi a quelle meno comuni, e promette prestazioni superiori rispetto ai modelli precedenti.

Arriva TranslateGemma di Google per la traduzioni AI

I modelli sono disponibili in tre dimensioni: 4B, 12B e 27B parametri. Secondo Big G, la versione intermedia da 12B è la più interessante, perché supera il modello base Gemma 3 da 27B. In pratica, ha meno della metà dei parametri, ma performa meglio del fratello maggiore. Un’ottima notizia per gli sviluppatori.

Google ha progettato ogni versione di TranslateGemma per un caso d’uso specifico. Il modello da 4B è ottimizzato per i dispositivi mobili, dove le risorse computazionali sono limitate. Il 12B è pensato per laptop consumer, abbastanza potente da girare su hardware casalingo senza richiedere configurazioni estreme. Il 27B, invece, ha bisogno dei muscoli: una singola GPU NVIDIA H100 nel cloud.

Del resto, non tutti hanno bisogno della versione più potente, e spesso la versione intermedia offre il miglior equilibrio tra prestazioni e praticità. Il fatto che il 12B batta il 27B base dimostra che più parametri non sempre significano migliori risultati, soprattutto quando si ottimizza il modello per compiti specifici.

Traduzione di testo nelle immagini

I test sul benchmark Vistra hanno mostrato che TranslateGemma è in grado di tradurre meglio il testo all’interno delle immagini, pur non essendo stato specificamente perfezionato per questo scopo. Un risultato interessante, considerando che tradurre il testo all’interno delle immagini è notoriamente complicato. Deve riconoscere il testo, capirne il contesto, tradurlo correttamente e poi magari reinserirlo nell’immagine mantenendo la formattazione e il layout.

Che TranslateGemma riesca a fare tutto questo senza un addestramento dedicato fa pensare che i modelli Gemma 3 hanno assorbito una comprensione profonda del linguaggio visivo durante l’addestramento, o che le tecniche di ottimizzazione usate da Google sono particolarmente efficaci.

ChatGPT Translate vs TranslateGemma

TranslateGemma arriva poche ore dopo ChatGPT Translate di OpenAI, ma i due strumenti hanno approcci leggermente diversi. ChatGPT Translate si concentra maggiormente sulla traduzione con tono e contesto corretti, evitando sostituzioni meccaniche parola per parola. Presenta un’interfaccia a due pannelli con rilevamento automatico della lingua, in stile Google Traduttore.

TranslateGemma, invece, è una suite di modelli open-weight che gli sviluppatori possono scaricare, modificare, integrare nei propri progetti. Non è un servizio pronto all’uso per l’utente finale, ma un toolkit per costruire soluzioni di traduzione personalizzate. Google sta puntando sull’ecosistema open-source, per permettere a chiunque di sperimentare e sviluppare applicazioni basate su questi modelli.

Disponibilità

I modelli TranslateGemma sono disponibili per il download su Kaggle e Hugging Face, le due piattaforme più popolari per la condivisione di modelli di machine learning. Chiunque può scaricarli, testarli, modificarli, integrarli in applicazioni esistenti o costruire nuovi strumenti da zero.

Per Google, rilasciare questi modelli come open-weight significa rinunciare al controllo diretto, ma guadagnare in distribuzione ed ecosistema. Se TranslateGemma diventa lo standard de facto per la traduzione automatica open-source, Google avrà influenzato un intero settore senza dover gestire direttamente ogni implementazione.

Visite totale 1 , 1 visite oggi
Scorri verso l'alto