Immagine AI

L’arena globale dell’intelligenza artificiale ha visto l’emergere di un contendente di altissimo livello che minaccia di ridefinire gli standard di eccellenza, in particolare nel settore open source: si tratta di Kimi K2 Thinking, l’ultima e sofisticata incarnazione del modello linguistico sviluppato dal laboratorio cinese Moonshot AI. Forte del supporto di colossi come Alibaba e guidato da ex ricercatori di Google e Meta, Moonshot AI ha lanciato Kimi K2 a luglio, stabilendo da subito un record con il suo trilione di parametri (one trillion parameters), una dimensione che lo colloca tra i modelli a “peso aperto” (open weight) più grandi mai resi disponibili al pubblico.

La versione “Thinking” di Kimi K2, rilasciata più di recente, non è semplicemente un aggiornamento, ma il risultato di un’ottimizzazione mirata a trasformare il modello in un agente pensante di alto livello. Questo modello è stato specificamente progettato per il ragionamento strutturato e l’uso dinamico di strumenti, con la capacità di eseguire lunghe sequenze di chiamate sequenziali a strumenti di supporto – come browser o interpreti di codice – in modo stabile e affidabile. Nei benchmark che misurano le capacità di ragionamento e di agentività, Kimi K2 Thinking sta ottenendo risultati che superano quelli dei modelli proprietari di punta sviluppati da OpenAI e Anthropic.

La superiorità di Kimi K2 Thinking si manifesta in test cruciali come l’Humanity’s Last Exam (HLE), dove stabilisce nuovi record grazie alla sua eccezionale capacità di ragionamento multi-dominio a livello esperto. Non si tratta solo di rispondere a singole domande, ma di risolvere problemi complessi e multi-fase, come dimostrato dalla sua abilità di affrontare un problema matematico a livello di Dottorato attraverso ben 23 passaggi concatenati di ragionamento e uso di strumenti. Questa profondità di elaborazione lo rende particolarmente efficace in ambiti che richiedono un’analisi complessa e l’uso di risorse esterne, come il competitive coding e l’utilizzo di tool avanzati.

A livello tecnico, il modello sfrutta un’architettura Mixture-of-Experts (MoE), un meccanismo che attiva solo le componenti della rete neurale (gli “esperti”) rilevanti per il compito in questione. Questa architettura non solo conferisce al modello una potenza di calcolo enorme, ma garantisce anche una notevole efficienza computazionale e una riduzione dei costi di inferenza, rendendolo un’alternativa economicamente vantaggiosa rispetto ai modelli closed-source occidentali. Inoltre, la sua architettura sfrutta l’INT4 quantization, che riduce notevolmente la latenza di inferenza e l’utilizzo di memoria GPU, portando la dimensione del modello scaricabile a poco meno di 600 gigabyte, un passo avanti significativo in termini di accessibilità e implementazione.

Nonostante sia rilasciato sotto una licenza MIT modificata — che mantiene un carattere “aperto” pur non essendo pienamente aderente alla definizione più rigorosa di open source — Kimi K2 Thinking rappresenta un catalizzatore di innovazione. La sua presenza sul mercato testimonia la determinazione della Cina non solo di competere, ma di guidare la prossima ondata di sviluppo nell’intelligenza artificiale. Offrendo prestazioni di altissimo livello a costi contenuti e un design intrinsecamente orientato all’agente digitale, Kimi K2 Thinking sta forzando i giganti occidentali a intensificare la loro ricerca, assicurando che la corsa all’eccellenza nell’IA rimanga più che mai aperta e in rapida evoluzione.

Di Fantasy