L’Università di Tsinghua presenta la tecnica Attention Offloading per ottimizzare l’inferenza degli LLM
Un nuovo studio dell’Università di Tsinghua ha rivelato che una riorganizzazione dell’hardware e dei calcoli può notevolmente abbassare i costi dell’inferenza per i modelli linguistici di grandi dimensioni (LLM). La…
LanceDB raccoglie 11 milioni di dollari per un database AI multimodale open source per lo sviluppo di app
I database tradizionali non sono stati progettati con l’intelligenza artificiale in mente. Gestire dati complessi come vettori, immagini, video e audio su larga scala diventa problematico. Archiviare questi dati è…
Vinci una DeLorean Elettrica con il concorso per sviluppatori API Gemini di Google
Google ha annunciato oggi alla conferenza I/O il suo concorso per sviluppatori API Gemini, che offre la possibilità di vincere premi in denaro fino a $300.000. La migliore app in…
Elastic Search AI Lake scalabile per dati Gen AI e ricerca vettoriale
Elastic ha presentato oggi una nuova tecnologia chiamata Search AI Lake, che rivoluziona il modo in cui gestisce i dati per l’intelligenza artificiale generativa, l’osservabilità e la sicurezza. Fondata principalmente…