Categoria: LMM Large Multimodal Models

Google potenzia Gemini con funzionalità di analisi video e condivisione schermo: verso l’assistente AI multimodale Project Astra

Durante il Mobile World Congress (MWC) a Barcellona, Google ha annunciato significativi aggiornamenti al suo modello di intelligenza artificiale, Gemini. Questi miglioramenti includono funzionalità di analisi video in tempo reale…

​UK rivede le norme sul copyright per l’addestramento AI

Negli ultimi anni, l’intelligenza artificiale (IA) ha compiuto progressi significativi, alimentando la necessità di vasti set di dati per l’addestramento dei modelli. Questo ha sollevato questioni cruciali riguardo all’uso di…

DeepSeek lancia DeepEP, una libreria di comunicazione per l’addestramento e l’inferenza di MoE

DeepSeek AI ha annunciato il rilascio di DeepEP, una libreria di comunicazione progettata per ottimizzare l’addestramento e l’inferenza dei modelli basati su Mixture of Experts (MoE). Questo lancio rappresenta il…

Zenos: il nuovo modello open source di sintesi vocale AI che supera i limiti dei Transformer

La sintesi vocale AI ha compiuto passi da gigante, permettendo la creazione di voci artificiali sempre più realistiche. Tuttavia, le architetture tradizionali, come i modelli Transformer, presentano limitazioni in termini…

PIN AI lancia un’app mobile per creare modelli personalizzati e privati direttamente sullo smartphone

Immagina un mondo in cui ogni individuo possiede un assistente AI personalizzato, capace di comprendere le proprie preferenze, passioni e obiettivi, tutto mantenendo la privacy e il controllo totale sui…

TWO AI lancia SUTRA-R0: un modello di ragionamento multilingue per decisioni aziendali complesse

TWO AI, una startup sostenuta da Jio, ha recentemente presentato SUTRA-R0, un avanzato modello di intelligenza artificiale progettato per affrontare scenari complessi e decisioni articolate in vari settori e lingue.…