Il nuovo corso con Andrew Ng per trasformare PDF, immagini e altro in dati compatibili con l’IA
Andrew Ng ha lanciato un nuovo corso chiamato “Preelaborazione di dati non strutturati per applicazioni LLM”, in collaborazione con la startup Unstructured di San Francisco. Unstructured si occupa di catturare…
Apple Ferret-UI per interfaccia utente mobile con AI
Con l’evento WWDC 2024 di Apple in arrivo a giugno, il colosso tecnologico punta a integrare l’intelligenza artificiale generativa nei suoi prodotti. Un nuovo protagonista è Ferret-UI, un modello LLM…
Elaborazione del linguaggio: Google Infini-Attention per LLM
I ricercatori di Google hanno ideato un nuovo metodo chiamato Infini-attention, per scalare i modelli LLM (Large Language Model) basati su Transformer per elaborare input di lunghezza infinita con memoria…
RULER: il nuovo benchmark di NVIDIA per valutare modelli linguistici
I ricercatori di NVIDIA hanno creato RULER, un nuovo benchmark per valutare l’efficacia dei modelli linguistici a contesto lungo (LLM) in diverse attività, come il recupero, il tracciamento multi-hop, l’aggregazione…