Recogni, una startup specializzata in chip e software per intelligenza artificiale (AI), ha presentato una nuova tecnologia chiamata Pareto, che promette di rendere i chip AI più piccoli, veloci ed economici.
Il nuovo metodo di calcolo Pareto riduce drasticamente il consumo energetico e i costi di produzione, migliorando le prestazioni dei chip per l’AI senza compromettere la precisione. Questo sistema trasforma le complesse operazioni di moltiplicazione delle matrici, normalmente utilizzate nei modelli di AI, in semplici operazioni di addizione. Questo approccio innovativo è più efficiente e richiede meno risorse.
Grazie a Pareto, i chip per AI diventano più compatti e i data center possono ridurre i costi operativi. Rispetto ai tradizionali formati numerici FP8 e FP16, Pareto offre una maggiore efficienza energetica e prestazioni migliori. I modelli di AI che utilizzano Pareto mostrano una perdita di precisione inferiore allo 0,1% con precisione a 16 bit e meno dell’1% con precisione a 8 bit, mantenendo alte le prestazioni senza necessità di riqualificazione.
“Convertendo la moltiplicazione in addizione, Pareto riduce significativamente il consumo energetico, la latenza e le dimensioni del chip, rendendolo la scelta ideale per i chip AI”, ha dichiarato Mark Bolisso, CEO di Recogni. “Questo metodo garantisce la qualità dei modelli di AI per una vasta gamma di applicazioni, mantenendo bassi i costi operativi.”
Pareto è stato testato con successo su vari modelli di AI, come ‘Mixtral-8x22B’, ‘Llama-70B’, ‘Falcon-180B’, ‘Stable Diffusion XL’ e ‘Llama 3.1-405B’, dimostrando una precisione superiore al 99,9% con un consumo energetico molto basso.