Nuovo framework WOLF genera sottotitoli automatici per video complessi
È stato recentemente presentato un nuovo framework chiamato “WOLF” (WOrLd summarization Framework) che promette di migliorare la generazione automatica di didascalie per video complessi, come quelli riguardanti la guida autonoma…
Meta negozia con VIP per usare le loro voci in un nuovo assistente vocale AI
Si dice che Meta stia negoziando con famosi attori di Hollywood, tra cui Judi Dench e Awkwafina, per ottenere il diritto di utilizzare le loro voci in progetti di intelligenza…
Senshu AI lancia Vidu: l’AI Video che rivaleggia con Sora
La startup cinese Senshu AI, autoproclamatasi “rivale di Sora”, ha lanciato un’intelligenza artificiale (AI) per la generazione di video a livello globale. Il nuovo modello di Senshu, chiamato Vidu, può…
Siti di notizie bloccano l’accesso a SearchGPT di OpenAI
Circa dieci siti di notizie, tra cui il New York Times (NYT), hanno vietato l’accesso al motore di ricerca AI “SearchGPT”. Questo divieto riguarda sia la raccolta di dati per…
aiOla nel riconoscimento vocale con il Whisper-Medusa
Oggi, la startup aiOla ha annunciato un nuovo modello di riconoscimento vocale open source, il Whisper-Medusa, che è il 50% più veloce rispetto al famoso Whisper di OpenAI. Il Whisper-Medusa,…
Figure presenta il nuovo robot umanoide Figure 02
La corsa per introdurre robot umanoidi con intelligenza artificiale nelle case e nei luoghi di lavoro di tutto il mondo ha avuto una nuova svolta oggi. Figure, un’azienda supportata da…
Google rilancia: i nuovi modelli Gemini e Gemma superano OpenAI
In un sorprendente cambiamento di direzione, Google si è ripresa da una serie di errori nel campo dell’intelligenza artificiale e ora si posiziona nuovamente come leader nel settore. Questa settimana,…
Andrej Karpathy e il progetto di trasformare un articolo del Wall Street Journal in un Video Musicale
Andrej Karpathy ha recentemente realizzato un progetto innovativo che trasforma un articolo del Wall Street Journal (WSJ) in un video musicale. Questo esperimento mostra le potenzialità della combinazione tra intelligenza…
Google DeepMind presenta Gemma Scope per comprendere gli LLM
I modelli linguistici di grandi dimensioni (LLM) sono diventati straordinari nel generare testi, tradurre lingue e creare contenuti creativi. Tuttavia, comprendere come funzionano questi modelli è una sfida, anche per…
Google licenza la tecnologia di Character AI e recluta i fondatori per DeepMind
Character AI, una startup che sviluppa avatar basati su intelligenza artificiale, ha annunciato oggi un accordo con Google. La startup concederà in licenza la sua tecnologia di modelli linguistici avanzati…