In un panorama globale segnato dalla carenza di unità di elaborazione grafica (GPU) per l’intelligenza artificiale, la startup edge AI Kneron sta individuando un’opportunità unica per promuovere la sua tecnologia di unità di elaborazione neurale (NPU) come valida alternativa.
Oggi, Kneron ha annunciato il lancio della sua più recente NPU, la KL730, con la promessa di offrire un’efficienza energetica fino a quattro volte superiore rispetto ai modelli preesistenti. Questo nuovo chip è stato appositamente progettato per accelerare modelli di intelligenza artificiale basati su trasformatori, tra cui il rinomato GPT.
Sebbene l’attenzione principale dell’offerta di silicio di Kneron sia rivolta alle applicazioni edge, come veicoli autonomi e ambiti medici e industriali, l’azienda non trascura il potenziale di adozione in campo aziendale. La collaborazione con aziende di calibro come Qualcomm e Foxconn, insieme alle implementazioni in partnership con Quanta nei server edge, offre una solida base di supporto.
Albert Liu, fondatore e CEO di Kneron, sottolinea che le NPU presentano diverse caratteristiche vantaggiose rispetto alle GPU. Egli afferma: “Le NPU vantano un maggior numero di core rispetto alle GPU, caratterizzandosi per efficienza e focalizzazione sulla connettività sfumata”.
Secondo Liu, le GPU non sono state originariamente progettate per l’intelligenza artificiale, ma piuttosto per l’ambito dei videogiochi. L’approccio di Kneron con le NPU mira a fornire una soluzione ottimizzata per le esigenze dell’IA, sfidando la narrativa che solo le GPU possano garantire prestazioni significative in questo campo.
Benché Nvidia continui a detenere una posizione dominante nel mercato delle GPU, offrendo una base solida per l’evoluzione dei grandi modelli di linguaggio e dell’IA generativa, Liu non è convinto che questa situazione rimarrà immutata nel tempo. Egli esprime la speranza che Kneron possa gradualmente guadagnare terreno nel panorama dell’IA mentre le organizzazioni cercano soluzioni sempre più innovative per soddisfare le crescenti esigenze in questo ambito.
I chip di Kneron sono basati su un’architettura IA riconfigurabile progettata per accelerare l’elaborazione dell’IA, differenziandosi dall’architettura delle GPU. Nel caso della KL730, l’architettura è stata ottimizzata appositamente per i modelli basati su trasformatori come il GPT.
La KL730 non è il primo chip di Kneron focalizzato sui trasformatori. Due anni fa, l’azienda ha introdotto il chip KL530 con funzionalità simili. Inizialmente concepito per applicazioni legate ai veicoli autonomi, si è rivelato adattabile anche per affrontare le sfide dei modelli di linguaggio di grandi dimensioni e dell’IA generativa.
Albert Liu spiega che l’architettura IA riconfigurabile permette al chip di adattarsi dinamicamente a nuovi modelli di IA, rendendolo versatile e adattabile a diverse esigenze.
Con il lancio della KL730, Kneron ha raggiunto significativi miglioramenti in termini di prestazioni della NPU. Secondo Liu, la KL730 supera le generazioni precedenti in termini di prestazioni ed è anche aggregabile. Questo significa che, se un singolo chip non è sufficiente per un’applicazione specifica, è possibile combinare più KL730 per creare una soluzione più ampia.
Sebbene i chip di Kneron siano attualmente impiegati principalmente per l’elaborazione dell’IA, Liu intravede la possibilità di sfruttare la capacità di aggregare più KL730 anche per l’addestramento dei modelli di machine learning, andando oltre le applicazioni di inferenza.
Liu sottolinea inoltre che Kneron ha già stabilito relazioni con clienti chiave nel settore server, tra cui Naver, Chunghwa Telecom e Quanta, mentre Foxconn, uno dei principali investitori strategici, collabora strettamente con l’azienda nello sviluppo di soluzioni AI per i server.
In sintesi, Kneron è impegnata a portare avanti la sua visione di offrire una soluzione di elaborazione dell’IA basata su NPU, mirando a sfidare l’egemonia delle GPU e a offrire un’alternativa competitiva per le sfide attuali e future legate all’IA e all’apprendimento automatico.