Immagine AI

Deep Cogito, startup con sede a San Francisco, ha recentemente attirato l’attenzione della comunità tecnologica con il lancio dei suoi modelli di linguaggio di grandi dimensioni (LLM) open source.​

Deep Cogito ha introdotto la serie Cogito v1, composta da modelli con dimensioni variabili da 3 miliardi a 70 miliardi di parametri. Questi modelli sono stati sviluppati come versioni avanzate dei modelli Llama 3.2 di Meta, incorporando capacità di ragionamento ibrido che combinano risposte immediate con processi di auto-riflessione, simili a quelli dei modelli “o” di OpenAI e DeepSeek R1. ​

La metodologia di formazione adottata da Deep Cogito, denominata Iterated Distillation and Amplification (IDA), rappresenta un’alternativa innovativa rispetto agli approcci tradizionali come l’apprendimento per rinforzo basato sul feedback umano (RLHF). L’IDA prevede l’allocazione di risorse computazionali per generare soluzioni migliorate, successivamente distillate nei parametri del modello, creando un ciclo di feedback che favorisce la crescita delle capacità del modello. ​

I modelli Cogito v1 sono disponibili sulla piattaforma di condivisione di codice AI Hugging Face, Ollama, nonché tramite API su Fireworks e Together AI. Sono rilasciati sotto i termini di licenza Llama, che ne consentono l’uso commerciale fino a 700 milioni di utenti mensili; oltre tale soglia, è necessaria una licenza a pagamento da Meta. ​

Deep Cogito ha in programma di rilasciare modelli ancora più grandi, con parametri fino a 671 miliardi, nei prossimi mesi. L’obiettivo a lungo termine dell’azienda è sviluppare un’intelligenza artificiale superintelligente, superiore all’intelligenza umana in tutti i domini, mantenendo un impegno verso l’open source e la trasparenza nello sviluppo dei modelli. ​

Di Fantasy