PyTorch 2.3: nuove funzionalità per LLM
PyTorch ha rilasciato la versione 2.3, con una serie di nuove funzionalità e miglioramenti mirati a rendere più efficiente l’addestramento di modelli linguistici di grandi dimensioni e l’inferenza sparsa. Tra…
Intelligenza Artificiale?
PyTorch ha rilasciato la versione 2.3, con una serie di nuove funzionalità e miglioramenti mirati a rendere più efficiente l’addestramento di modelli linguistici di grandi dimensioni e l’inferenza sparsa. Tra…
Negli ultimi anni, i modelli linguistici di grandi dimensioni (LLM) hanno fatto progressi enormi, passando da gestire solo poche centinaia di parole di input a comprendere il contenuto di diversi…
I ricercatori della Nanyang Technological University, della Singapore University of Technology and Design e della DAMO Academy di Alibaba hanno sviluppato LLM-R2, un sistema per ottimizzare le query SQL. Questo…
Molte startup di intelligenza artificiale (AI) stanno utilizzando i dati generati da “ChatGPT” di OpenAI per costruire i propri chatbot. Questa pratica, considerata un furto di dati, è ampiamente nota…
Hazelcast ha lanciato la versione 5.4 della sua piattaforma di elaborazione dati in tempo reale, con miglioramenti mirati a ottimizzare i carichi di lavoro operativi e di intelligenza artificiale (AI).…
Intel ha presentato il suo nuovo sistema informatico neuromorfico chiamato Hala Point, che utilizza 1.152 processori Loihi 2. L’obiettivo è contribuire alla ricerca sull’intelligenza artificiale ispirata al cervello e sviluppare…
Stability AI ha lanciato ufficialmente il suo modello di intelligenza artificiale generativa di prossima generazione, Stable Diffusion 3, dopo solo un paio di mesi di anteprima. Insieme all’aggiornamento, l’azienda ha…
L’introduzione della memoria di attenzione del feedback offre un nuovo approccio aggiungendo attivazioni di feedback che alimentano la rappresentazione contestuale in ciascun blocco di attenzione della finestra scorrevole. Un team…
Meta ha lanciato MEGALODON, un’architettura neurale progettata per gestire sequenze di lunghezza illimitata in modo più efficiente. Questo modello mira a superare i limiti dell’architettura Transformer, come la complessità computazionale…
La piattaforma COBOL, essenziale per molti sistemi finanziari e governativi, si trova in una situazione critica con la crescente mancanza di competenze e l’avvicinarsi della data di scadenza. Mentre il…