Modelli LLM a contesto lungo: il caso di Gradient e Crusoe
In una recente collaborazione, la startup AI Gradient e la piattaforma di cloud computing Crusoe hanno esteso la “finestra di contesto” dei modelli Llama-3 fino a 1 milione di token.…
Intelligenza Artificiale?
In una recente collaborazione, la startup AI Gradient e la piattaforma di cloud computing Crusoe hanno esteso la “finestra di contesto” dei modelli Llama-3 fino a 1 milione di token.…
Recentemente è emerso che due delle più grandi startup di intelligenza artificiale al mondo, OpenAI e Anthropic, sono coinvolte in pratiche di “crawling”, ossia nel raccogliere dati web indiscriminatamente per…
Poolside, una startup francese specializzata in intelligenza artificiale, ha ottenuto un notevole successo finanziario, raccogliendo 400 milioni di dollari da investitori come Brain Capital Ventures e DST. L’azienda, fondata da…
Un nuovo studio condotto dall’Indian Institute of Madras e AI4Bharat ha messo in luce importanti difetti nei metodi attuali utilizzati dai Large Language Models (LLM) per valutare la generazione di…
Sierra, la startup AI per l’esperienza del cliente co-fondata da Bret Taylor di OpenAI e Clay Bavor di Google, ha introdotto un nuovo standard, chiamato TAU-bench, per valutare gli agenti…
Anthropic, una delle principali aziende di ricerca sull’intelligenza artificiale, ha lanciato Claude 3.5 Sonnet, un nuovo modello rivoluzionario che unisce prestazioni eccezionali a un costo accessibile. Quest’ultima iterazione della famiglia…
I ricercatori dell’Università di Oxford hanno scoperto un nuovo metodo per rilevare le allucinazioni nelle risposte generate dai modelli di intelligenza artificiale (AI). Questo metodo si concentra su un tipo…
Un recente documento di ricerca ha rivelato che il modello linguistico ChatGLM sviluppato dall’Università di Tsinghua e Zhipu AI, noto come GLM-4, ha dimostrato di equiparare o superare le capacità…
Florence-2 è disponibile con licenza MIT permissiva e può gestire una vasta gamma di attività visive e di linguaggio visivo utilizzando una rappresentazione unificata basata su prompt. Offre due dimensioni:…
I grandi modelli linguistici (LLM), alimentati da enormi quantità di dati e potenza di calcolo, stanno rivoluzionando l’intelligenza artificiale. Tuttavia, recenti studi suggeriscono che l’idea prevalente nel settore, secondo cui…