Il mese scorso, Databricks, un importante attore nel campo dell’elaborazione dei dati, ha annunciato l’acquisizione di MosaicML, una piattaforma di intelligenza artificiale generativa, in un accordo del valore di circa 1,3 miliardi di dollari.
L’obiettivo di questa acquisizione era rendere l’IA generativa accessibile alle imprese, consentendo loro di costruire, possedere e proteggere i migliori modelli di IA generativa, mantenendo il controllo dei propri dati. Ali Ghodsi, CEO di Databricks, ha sottolineato l’importanza di democratizzare l’IA e di rendere il concetto di “Lakehouse” il punto di riferimento per la costruzione di modelli generativi di intelligenza artificiale.
MosaicML è riconosciuta per i suoi modelli di linguaggio MPT all’avanguardia, che consentono alle aziende di creare e addestrare rapidamente i propri modelli utilizzando i propri dati in modo conveniente. L’azienda è anche redditizia, poiché offre servizi economici in linea con gli open source leader come LLaMA e Falcon.
Fondata nel 2016 da Naveen Rao, un ingegnere elettrico di Stanford, e Hanlin Tang, laureato ad Harvard, MosaicML ha raccolto un totale di 37 milioni di dollari in finanziamenti in due round, l’ultimo dei quali è stato completato il 1 gennaio 2023.
MosaicML offre agli sviluppatori diverse opzioni per utilizzare la sua piattaforma, tra cui un’API per l’integrazione semplice nelle applicazioni front-end e la possibilità di personalizzare i modelli con i propri dati. Gli sviluppatori possono anche pre-addestrare i modelli personalizzati da zero utilizzando gli strumenti di MosaicML e servirli attraverso la piattaforma. La compatibilità di MosaicML con strumenti di terze parti come LangChain consente agli sviluppatori di sfruttare ulteriori strumenti oltre ai propri modelli personalizzati, offrendo flessibilità e controllo sull’intero modello.
MosaicML si differenzia dalla concorrenza non solo fornendo la sua tecnologia tramite noleggio, ma anche offrendo il suo codice ai clienti. Ciò consente ai clienti di eseguire il codice sul proprio hardware, garantendo la riservatezza dei propri dati rispetto a MosaicML. Questo approccio risuona particolarmente con le aziende che pongono la privacy dei dati come priorità, poiché il valore di un sistema di intelligenza artificiale dipende fortemente dai dati di addestramento utilizzati.
L’azienda riconosce l’importanza dei modelli open source, soprattutto in settori che gestiscono dati sensibili, in cui la personalizzazione locale e il controllo del modello sono cruciali. MosaicML si concentra su settori specifici come l’assistenza sanitaria e le banche, fornendo la capacità di interpretare e riassumere grandi quantità di dati in modo sicuro.
MosaicML afferma di rendere la sua tecnologia accessibile a tutte le organizzazioni a un prezzo significativamente inferiore, fino a 15 volte inferiore rispetto ai suoi concorrenti. Importanti clienti come AI2, Generally Intelligent, Hippocratic AI, Replit e Scatter Labs utilizzano MosaicML per vari casi d’uso di IA generativa.
Il modello MPT-30B LLM di MosaicML, con 30 miliardi di parametri, supera in qualità il GPT-3 di OpenAI, nonostante abbia un numero inferiore di parametri. Ciò rende l’esecuzione su hardware locale più semplice e conveniente per l’implementazione. Il meccanismo di attenzione utilizzato da MosaicML, chiamato “FlashAttention”, consente inferenze e addestramenti più veloci, rendendo il processo più efficiente rispetto a Falcon e LLaMA. Inoltre, il modello MPT-30B è progettato per adattarsi ai vincoli dell’hardware reale, ottimizzando le prestazioni su GPU di deep learning.
MosaicML afferma anche che il modello MPT-30B si confronta favorevolmente con LLaMA e Falcon in termini di prestazioni. Il modello richiede meno potenza di calcolo per l’addestramento, offrendo risultati simili, con particolare eccellenza nelle attività di codifica. Tuttavia, le affermazioni di MosaicML devono ancora essere verificate in modo indipendente utilizzando la misura HELM di Stanford.
Nonostante alcuni confronti e critiche, MosaicML considera alla fine gli LLM open source, tra cui LLaMA e Falcon, come parte del proprio team. L’azienda ritiene che le piattaforme proprietarie come OpenAI rappresentino una concorrenza reale e sottolinea il potere abilitante degli LLM open source, che restituiscono il controllo agli sviluppatori aziendali. MosaicML crede che gli LLM open source stiano colmando il divario con i modelli closed-source e abbiano raggiunto un punto in cui sono estremamente utili, anche se non li hanno ancora completamente superati.
Databricks si è posizionata saldamente sul mercato attraverso diverse mosse strategiche. L’introduzione di LakehouseIQ, l’acquisizione di MosaicML e lo sviluppo di Unity Catalog hanno permesso a Databricks di mantenere una posizione di vantaggio nel mercato e di competere per ottenere quote di mercato incrementali.
La piattaforma di MosaicML sarà integrata e ampliata nel tempo per fornire una piattaforma unificata in cui i clienti possono costruire, possedere e proteggere i propri modelli di intelligenza artificiale generativa. Per Databricks, l’acquisizione di MosaicML rappresenta una mossa strategica per fornire alle aziende gli strumenti per costruire modelli di linguaggio di grandi dimensioni in modo semplice ed economico utilizzando i propri dati proprietari.
Integrando questo processo nella più ampia catena di strumenti e flusso di lavoro di Databricks, l’azienda mira a ridurre i costi associati alla formazione e all’esecuzione di modelli di linguaggio di grandi dimensioni. Questa strategia riconosce la domanda di modelli di linguaggio di grandi dimensioni specializzati, che sono più convenienti e ottimizzati per compiti specifici. Mentre i modelli di linguaggio di grandi dimensioni generici continueranno ad esistere, Databricks vede un’opportunità per soddisfare la necessità di soluzioni personalizzate. Sia Snowflake che Databricks stanno lavorando attivamente per fornire governance e protezione della proprietà intellettuale di livello aziendale come parte delle loro offerte di modelli di linguaggio di grandi dimensioni specializzati.
La piattaforma Databricks Lakehouse, combinata con la tecnologia di MosaicML, fornirà ai clienti un modo semplice e veloce per mantenere il controllo, la sicurezza e la proprietà dei loro preziosi dati senza costi elevati. MosaicML sostiene che la sua ottimizzazione automatica dell’addestramento del modello consente di ridurre i tempi di addestramento da 2 a 7 volte rispetto agli approcci standard.