Kneron, azienda specializzata in unità di elaborazione neurale (NPU), ha presentato alla conferenza Computex le sue ultime innovazioni nel campo dell’intelligenza artificiale (AI). L’obiettivo è quello di offrire un’alternativa alle GPU per l’inferenza AI all’avanguardia e la messa a punto dei modelli.
La nuova generazione di chip NPU di Kneron, KL830 e KL1140 (previsto per il 2025), promette prestazioni elevate e basso consumo energetico, aprendo nuove possibilità per l’implementazione dell’AI in diversi dispositivi.
Un’applicazione interessante è la creazione di server GPT privati, che possono essere eseguiti localmente senza la necessità di connettività cloud. Il server KNEO 330 Edge GPT di Kneron, basato sul chip KL830, offre questa funzionalità a prezzi accessibili per le imprese.
Oltre all’hardware, Kneron sta sviluppando anche strumenti software per la formazione e la messa a punto di modelli AI sui propri chip. Questi strumenti consentono di scaricare modelli addestrati con framework come TensorFlow e compilarli per l’uso su NPU Kneron.
Un’altra caratteristica interessante è il supporto per i flussi di lavoro RAG (Retrieval-Augmented Generation), che consentono di ridurre il fabbisogno di memoria per i grandi database vettoriali.
Il punto di forza della tecnologia Kneron è il basso consumo energetico. Il chip KL830, ad esempio, ha un consumo di picco di soli 2 watt, pur offrendo prestazioni elevate. Questo permette di integrare i chip Kneron in vari dispositivi senza la necessità di sistemi di raffreddamento aggiuntivi.