GPT-4o di OpenAI: cosa significa per gli sviluppatori
Ieri, OpenAI ha fatto un annuncio importante, anticipando la conferenza degli sviluppatori di Google I/O con il lancio del suo nuovo modello di intelligenza artificiale di base, chiamato GPT-4o. Questo…
Google presenta Imagen 3
Google sta per rilasciare un aggiornamento del suo modello da testo a immagine chiamato Imagen 3, promettendo un livello di dettaglio sorprendente, una migliore comprensione del linguaggio naturale e una…
Google Gemini 1.5 Flash, piccolo modello multimodale rapido
Google ha appena annunciato il lancio di Gemini 1.5 Flash, un nuovo modello multimodale più piccolo progettato per affrontare rapidamente compiti specifici. È disponibile da oggi tramite l’API Gemini su…
Google presenta PaliGemma: nuovo modello multimodale per elaborazione visiva e linguistica
Google ha sviluppato un nuovo modello multimodale di linguaggio visivo sotto il suo ombrello Gemma di modelli aperti leggeri. Denominato PaliGemma, è progettato per affrontare la didascalia delle immagini, la…