Google ha annunciato la disponibilità del suo potente modello di intelligenza artificiale generativa, Gemini, per le aziende interessate a sviluppare applicazioni basate su questa tecnologia.

Gemini è stato annunciato la scorsa settimana e viene offerto in tre diverse varianti: Ultra, Pro e Nano. Oggi, Google ha reso accessibile tramite API la versione Pro di Gemini. Attualmente, l’uso è gratuito, ma ci sono alcune restrizioni, come dichiarato dalla società in un post sul blog.

Oltre a questa novità, Google ha effettuato una serie di altri annunci nel campo dell’intelligenza artificiale, tra cui l’aggiornamento del suo strumento di testo-immagine chiamato Imagen 2 e una famiglia di modelli di base ottimizzati per il settore sanitario.

La prima versione di Gemini Pro è ora disponibile tramite l’API Gemini in Google AI Studio, una piattaforma di sviluppo basata sul Web che consente agli sviluppatori di creare prompt e ottenere una chiave API per l’utilizzo nelle loro applicazioni. Attualmente, offre una finestra di contesto da 32K per la generazione di testo, ma questa capacità sarà ulteriormente ampliata in futuro.

Google ha anche annunciato la disponibilità di un endpoint multimodale dedicato per Gemini Pro Vision, che consente l’input di testo e immagini con output testuale.

In un annuncio ufficiale, Sundar Pichai, CEO di Google, ha sottolineato che l’API Gemini offre agli sviluppatori un’ampia gamma di funzionalità, tra cui chiamate di funzioni, incorporamenti, recupero semantico, conoscenza personalizzata e funzionalità di chat. Supporta inoltre 38 lingue in oltre 180 paesi.

Oltre ad AI Studio, Gemini Pro sarà presto disponibile su Vertex AI, la piattaforma end-to-end di Google Cloud per l’intelligenza artificiale, che offre strumenti, infrastrutture completamente gestite e funzionalità integrate di privacy e sicurezza. Questo permetterà agli sviluppatori di passare a un ambiente completamente gestito quando lo desiderano.

Google prevede di utilizzare il feedback degli sviluppatori per perfezionare Gemini Pro e sta lavorando al lancio dell’edizione più avanzata, Gemini Ultra, l’anno prossimo, progettata per compiti ancora più complessi.

Attualmente, l’accesso a Gemini Pro e Gemini Pro Vision è gratuito con un limite di velocità di 60 richieste al minuto. Lo stesso vale per gli sviluppatori che utilizzano i modelli su Vertex AI, ma questa offerta sarà valida solo fino alla disponibilità generale dell’anno prossimo. In seguito, Google prevede di addebitare un costo per 1.000 caratteri o per immagine sia su Google AI Studio che su Vertex AI.

Da notare che il prezzo di input di Gemini Pro è di $0,00025 per 1.000 caratteri e $0,0025 per immagine, mentre il prezzo di output per entrambi rimane invariato a $0,0005 per 1.000 caratteri. È importante notare che questo modello di prezzo è basato su “per carattere”, il che significa che Google addebiterà per ogni lettera o numero generato dal modello, a differenza di altri concorrenti che utilizzano il modello di prezzo “per token”, dove un token può rappresentare una parola intera.

Inoltre, Google ha anche annunciato l’aggiornamento di Vertex AI con Imagen 2, una tecnologia di generazione testo-immagine avanzata che offre nuove funzionalità, tra cui la capacità di creare una vasta gamma di loghi, emblemi e segni di lettere creativi e realistici. Questo strumento può ottenere risultati migliori rispetto ai concorrenti quando si tratta di rendering del testo in più lingue.

Infine, Google ha reso disponibile la famiglia di modelli di base ottimizzati per il settore sanitario, chiamata MedLM, per le organizzazioni con sede negli Stati Uniti tramite Vertex AI. Questi modelli saranno presto aggiornati sulla base delle funzionalità di Gemini.

Di Fantasy