Ecco il generatore di immagini di intelligenza artificiale (IA) di Google per il grande pubblico… più o meno.
A seguito del lancio del nuovo generatore di immagini AI Firefly 2 di Adobe e dell’introduzione di OpenAI del suo nuovissimo generatore di immagini DALL-E 3, ampiamente integrato in ChatGPT Plus (e offerto anche tramite Bing Image Creator di Microsoft per gli investitori e i clienti), Google ha annunciato questa settimana che stava introducendo una funzionalità di intelligenza artificiale per la generazione di testo in immagini direttamente nella Ricerca Google. Tuttavia, questa funzionalità è disponibile solo per coloro che attivano la “Search Generative Experience” (SGE) all’interno dei Google Search Labs, il programma di test sperimentale dell’azienda.
“Hem a Budaraju, direttore senior della gestione del prodotto presso Ricerca Google, ha scritto sul blog ufficiale dell’azienda: “Crediamo che l’intelligenza artificiale generativa nella ricerca possa stimolare la creatività e aiutarti a ottenere di più. Non vediamo l’ora di continuare i test e di ricevere i feedback degli utenti”.
Ma non è tutto, Google ha anche introdotto una nuova funzionalità che consente agli utenti di comporre bozze di testo in stile Google Docs utilizzando l’intelligenza artificiale nella ricerca. Questi documenti possono poi essere esportati in Gmail o Google Docs. Budaraju ha citato l’esempio di scrivere una nota per un agente immobiliare come caso d’uso potenziale.
Un portavoce di Google ha confermato che la nuova funzionalità di creazione di immagini è alimentata da “Imagen”, il modello di base proprietario di Google per la generazione di immagini AI. Questo modello è già disponibile dal mese di maggio tramite l’ambiente di sviluppo e distribuzione di intelligenza artificiale di Google Cloud Vertex, ma richiede una carta di credito per l’accesso (anche se l’utilizzo iniziale è gratuito).
Inoltre, Google ha condiviso una simpatica GIF animata che mostra come il suo nuovo generatore di immagini AI per la ricerca in Search possa essere utilizzato per creare diverse versioni di un capibara che indossa un cappello da chef, semplicemente digitando “disegna un’immagine di un…” seguito dalla descrizione dell’immagine desiderata nella barra di ricerca.
Tuttavia, nonostante VentureBeat abbia attivato l’esperienza Search Labs seguendo il link fornito nel post sul blog di Google venerdì, la capacità di generare immagini non era ancora disponibile.
Interpellato da VentureBeat sulla mancanza di accessibilità, un portavoce di Google ha risposto via email: “Abbiamo annunciato che queste funzionalità sono state appena introdotte a partire da ieri (in inglese negli Stati Uniti), quindi se non le hai ancora, continuate a seguirci :).”
In effetti, questa situazione ricorda quanto fatto da OpenAI con ChatGPT e la sua graduale implementazione delle funzionalità visive e audio, che è durata due settimane.
Per quanto riguarda la disponibilità generale della creazione di immagini nella Ricerca Google, al di fuori dell’attivazione di Search Labs/SGE, il portavoce di Google ha affermato: “SGE è un esperimento di attivazione disponibile in Search Labs, che è un nuovo programma per consentire alle persone di testare i nuovi prodotti e le idee audaci che stiamo esplorando. Search Labs è disponibile nell’app Google (Android e iOS) e su Chrome desktop.”
Purtroppo, la confusione sulla disponibilità e sull’accesso alla generazione di immagini AI nella Ricerca Google potrebbe non essere un inizio ideale per questa funzionalità di Google, specialmente quando ci sono già numerosi altri generatori di immagini AI concorrenti sul mercato facilmente accessibili a tutti gli utenti.
Il mese scorso, Google ha aggiornato il suo chatbot AI Bard, basato sul modello LLM (Large Language Model) PaLM 2 Foundation, per integrarlo con altri prodotti Google Apps come Gmail e Drive. Tuttavia, i test di VentureBeat su queste nuove integrazioni non hanno prodotto risultati particolarmente brillanti. Inoltre, un nuovo rapporto di Fortune suggerisce che persino gli stessi dipendenti di Google non sono soddisfatti del prodotto e esprimono dubbi interni sulla sua utilità, con alcuni che si chiedono in generale a cosa servano gli LLM.
Recentemente, Bard ha affrontato un imbarazzante problema quando è emerso che i collegamenti alle conversazioni di Bard venivano indicizzati dalla Ricerca Google e apparivano nei risultati di ricerca pubblici, anche se l’utente aveva scelto di condividerli solo con un terzo (Google ha da allora risolto il problema).
Nel frattempo, si dice che OpenAI abbia superato un fatturato annuo di 1,3 miliardi di dollari, principalmente grazie al successo del suo prodotto AI esclusivo, ChatGPT basato su LLM, che offre un abbonamento individuale a $20 al mese, oltre a piani aziendali e un’API a pagamento.
Questa settimana su X, diverse persone, tra cui l’autore di VentureBeat, hanno condiviso numerosi esempi dell’efficacia del nuovo modello GPT-4V o modello di visione dell’azienda, che alimenta l’ultima versione di ChatGPT con funzionalità di analisi visiva e audio. Questo nuovo modello ha dimostrato di essere davvero impressionante ed utile, salvando persino un automobilista esausto a New York da una multa per parcheggio. Un valido argomento a favore dell’utilità degli LLM nel mondo reale.
In conclusione, aspettiamo ancora con impazienza il rilascio pubblico del tanto atteso nuovo modello di base AI di Google, Gemini, che mira a essere “più potente” di ChatGPT.