SambaNova e Gradio per l’inferenza AI

SambaNova Systems e Gradio hanno lanciato una nuova integrazione che consente agli sviluppatori di accedere a una delle piattaforme di inferenza AI più veloci con solo poche righe di codice. Questa partnership ha l’obiettivo di rendere i modelli AI ad alte prestazioni più accessibili e di accelerare l’adozione dell’intelligenza artificiale tra sviluppatori e aziende.

L’integrazione consente di creare applicazioni web basate sui modelli AI veloci di SambaNova attraverso la funzione gr.load() di Gradio. Gli sviluppatori possono rapidamente generare interfacce di chat collegate ai modelli di SambaNova, facilitando l’uso di sistemi AI avanzati.

SambaNova, una startup della Silicon Valley supportata da SoftBank e BlackRock, ha fatto notizia nel settore dell’hardware AI grazie ai suoi chip di architettura dataflow. Questi chip sono progettati per superare le tradizionali GPU, e l’azienda sostiene di offrire “il servizio di inferenza AI più veloce al mondo”. La piattaforma di SambaNova è in grado di eseguire il modello Llama 3.1 405B di Meta a 132 token al secondo, una velocità cruciale per le aziende che intendono implementare l’intelligenza artificiale su larga scala.

Questo annuncio arriva in un momento in cui il mercato delle infrastrutture AI è in crescita, con startup come SambaNova, Groq e Cerebras che sfidano il predominio di Nvidia nel settore dei chip AI. Questi nuovi attori si concentrano sull’inferenza, la fase di produzione in cui i modelli generano output basati sul loro addestramento, un mercato che si prevede crescerà rapidamente.

Secondo i dati dell’azienda, i chip AI di SambaNova mostrano un’efficienza energetica da 3 a 5 volte migliore rispetto alla GPU H100 di Nvidia quando eseguono modelli linguistici di grandi dimensioni.

L’integrazione SambaNova-Gradio offre agli sviluppatori un modo semplice per esplorare l’IA ad alte prestazioni. Gli utenti possono utilizzare il piano gratuito di SambaNova per trasformare qualsiasi modello supportato in un’app web e ospitarla autonomamente in pochi minuti. Questa facilità d’uso è in linea con le recenti tendenze del settore che mirano a semplificare lo sviluppo di applicazioni AI.

Attualmente, l’integrazione supporta la famiglia di modelli Llama 3.1 di Meta, incluso il modello con 405 miliardi di parametri. SambaNova afferma di essere l’unico fornitore in grado di eseguire questo modello con precisione a 16 bit ad alta velocità, il che è particolarmente vantaggioso per applicazioni che richiedono grande accuratezza, come nel settore sanitario e nei servizi finanziari.

Nonostante l’integrazione renda l’AI ad alte prestazioni più accessibile, ci sono preoccupazioni sui potenziali effetti a lungo termine della crescente competizione per i chip AI. Con l’aumento della richiesta di velocità di elaborazione, emergono dubbi riguardo all’uso energetico, alla scalabilità e all’impatto ambientale.

Mentre le aziende si concentrano su metriche come i token al secondo, è fondamentale considerare anche fattori come il costo totale di proprietà, inclusi consumo energetico e raffreddamento. Inoltre, l’ecosistema software che supporta questi chip AI influenzerà la loro adozione. Sebbene SambaNova e altri offrano hardware potente, l’ecosistema CUDA di Nvidia ha un vantaggio grazie alla sua ampia gamma di librerie e strumenti già ben noti agli sviluppatori AI.

Man mano che il mercato delle infrastrutture AI continua a evolversi, collaborazioni come quella tra SambaNova e Gradio potrebbero diventare sempre più comuni. Queste partnership hanno il potenziale di stimolare innovazione e competizione in un settore che promette di rivoluzionare molte industrie. Tuttavia, il vero test sarà vedere come queste tecnologie si traducano in applicazioni pratiche e se possano mantenere la promessa di un’AI più accessibile, efficiente e potente per tutti.

SambaNova e Gradio per l’inferenza AI

DiFantasy

Di Fantasy

Articoli correlati

UCM di Huawei: il software che sostituisce l’hardware per l’efficienza dell’AI

Addio a xAI: Igor Babuschkin vola verso la sicurezza dell’IA con la sua nuova missione

Anthropic acquisisce il team di Humanloop per l’AI enterprise

You missed

UCM di Huawei: il software che sostituisce l’hardware per l’efficienza dell’AI

Addio a xAI: Igor Babuschkin vola verso la sicurezza dell’IA con la sua nuova missione

Anthropic acquisisce il team di Humanloop per l’AI enterprise

Grok in tilt: quando l’AI genera più domande di quante ne risponda