EXO: quando l’inferenza AI diventa cooperazione tra computer, non gara tra GPU
Nell’evoluzione dell’intelligenza artificiale, un tema ricorrente è come eseguire modelli grandi (LLM) con efficienza su hardware accessibile. Acquistare acceleratori potenti e costosi è una strada, ma non l’unica né sempre…
Verbalized Sampling, tecnica di prompting per liberare la diversità latente negli LLM
In ambito di modelli linguistici generativi (LLM, Large Language Models), una delle criticità che emerge spesso è il fenomeno detto mode collapse, cioè la tendenza del modello a produrre risposte…
Anthropic Skills per rendere Claude e Agenti AI più veloci e coerenti
Quando pensiamo ad assistenti artificiali aziendali, spesso immaginiamo uno strumento generico, capace di rispondere a domande, scrivere testi o eseguire calcoli. Ma il vero salto di qualità avviene quando quell’assistente…
ACE, un nuovo modo per far ricordare meglio le AI e prevenire il collasso del contesto
Quando pensiamo a un agente intelligente — un’IA che opera con una certa autonomia, che prende decisioni, che interagisce nel tempo — uno dei problemi più sottili ma cruciali è…