Google Gemini lancia Imagen 3: una delusione generale

Google ha appena annunciato un importante aggiornamento per Gemini: la piattaforma ora supporta la generazione di immagini tramite Imagen 3 e i Gems, in italiano.
Questo annuncio suscita grandi aspettative, aprendo nuove possibilità per la creatività digitale, ma solleva anche interrogativi sulle reali capacità e limitazioni della piattaforma. Questo è un passo importante verso una creatività senza limiti, ma come funziona veramente? Quali sono i vantaggi e le limitazioni di questa nuova funzionalità?
Imagen 3 e la promessa di Google
Con Imagen 3, Google ha annunciato che promette di trasformare le parole in immagini straordinarie. Tra le caratteristiche principali, Imagen 3 offre:
-
Qualità migliorata: immagini realistiche con dettagli nitidi e colori intensi.
-
Stili differenti: dalle pitture a olio alle scene di claymation, c'è una varietà per ogni esigenza creativa.
-
Dettagli fotorealistici: animali domestici, paesaggi e altri soggetti sono riprodotti con dettagli precisi e realistici.
Google punta molto sulla personalizzazione delle immagini, ma le prime prove pratiche sembrano dimostrare che la realtà è un po' diversa dalle aspettative.
Cosa sono i Gems?
Oltre a Imagen 3, Google ha introdotto i Gems, versioni personalizzate di Gemini che possono essere salvate e utilizzate in qualsiasi momento. Sono esperti AI personalizzati che possono aiutare in una vasta gamma di argomenti, dal generatore di idee al consulente di carriera. Gli utenti possono iniziare gratuitamente con una prova di un mese di Gemini Advanced e sperimentare tutta la potenza dei Gems predefiniti.
Prova pratica di Gemini e Imagen 3: funzionalità e limitazioni
Abbiamo effettuato una prova pratica di Gemini e il risultato è stato piuttosto deludente rispetto alle promesse di Google. Ecco alcune delle esperienze più rilevanti:
1. Qualità delle Immagini
Quando abbiamo richiesto a Imagen 3 di generare un'immagine di un drago, il risultato è stato una rappresentazione piuttosto basilare, senza la complessità e i dettagli che ci si aspetterebbe da un'intelligenza artificiale avanzata come Gemini.
2. Limiti Etici e Normativi
Abbiamo provato a chiedere a Gemini di rappresentare l'Ultima Cena di Gesù come una festa moderna, ma il sistema si è rifiutato, citando le linee guida che vietano argomenti controversi. Questo dimostra una certa attenzione alle sensibilità etiche, ma limita notevolmente le possibilità creative degli utenti. Anche la richiesta di un quadro con i principali politici italiani è stata rifiutata. Anche la richiesta di un quadro dei principali mestieri italiani non ha avuto seguito con errore "Gemini Advanced sarà presto in grado di generare immagini di persone"
3. Nessuna Generazione di Immagini di Persone
Una delle maggiori delusioni è stata la risposta negativa quando abbiamo chiesto di generare un'immagine di una persona. Al momento, Gemini non è in grado di generare ritratti umani, o rappresentazioni che includano umani, il che rappresenta un problema significativo. Questa limitazione non solo lascia una lacuna rispetto alla concorrenza, ma limita anche l'utilità della piattaforma per molti utenti che desiderano creare contenuti più personalizzati o artistici.
La mancanza di questa funzionalità potrebbe ridurre l'attrattiva di Gemini per artisti, creativi e professionisti che necessitano di una soluzione versatile per la generazione di immagini, influenzando negativamente la sua adozione sul mercato.
4. Inesattezze nel Formato delle Immagini
Abbiamo chiesto a Imagen 3 di creare un'immagine delle Alpi nel formato 16:9, ma nonostante le ripetute richieste, l'output è stato sempre in formato quadrato. Questo problema di flessibilità nel formato è sicuramente un punto debole che lo rende inutile per coloro i quali lavorano in ambito digitale.
5. Assenza di Modifica Parziale delle Immagini
Una delle funzionalità più richieste nei generatori di immagini è la capacità di modificare parzialmente l'immagine generata. Gemini, al momento, non offre questa opzione: se un dettaglio non soddisfa, l'unica alternativa è rifare l'intera immagine da capo, rendendo l'esperienza molto meno intuitiva e frustrante per gli utenti più esigenti.
Google è davvero all'altezza?
L'aggiornamento di Gemini con Imagen 3 e i Gems rappresenta un tentativo ambizioso di Google di entrare nel mondo della generazione di immagini tramite IA, ma sembra ancora lontano dall'essere pronto per un pubblico ampio. Le limitazioni tecniche e le mancanze nella flessibilità rendono questo strumento decisamente inferiore rispetto ai principali concorrenti, come Midjourney e DALL-E. Midjourney, ad esempio, offre una qualità di immagine superiore e maggiore varietà stilistica, mentre DALL-E consente la modifica parziale delle immagini, una funzionalità molto richiesta che Gemini al momento non supporta.
Se da Google ci si aspetta sempre innovazione e qualità superiore, questa volta Gemini sembra essere una vera delusione. Tuttavia, c'è ancora spazio per miglioramenti futuri, ed è possibile che Google utilizzi questo feedback per rendere Gemini più performante e in linea con le aspettative del pubblico.
Articolo di Marco Galassi