Redpanda sta vivendo una notevole crescita sulla sua piattaforma di dati in streaming, grazie alla sempre crescente richiesta di dati in tempo reale e ai nuovi casi d’uso nell’intelligenza artificiale (AI).
Oggi, l’azienda ha annunciato di aver ottenuto $100 milioni in un round di finanziamento di serie C, portando il totale dei finanziamenti per la startup con sede a San Francisco a $165 milioni. Questo nuovo finanziamento rappresenta un significativo aumento rispetto ai $50 milioni ottenuti nella serie B di Redpanda a febbraio 2022.
La piattaforma di dati in streaming di Redpanda consente alle imprese di raccogliere, archiviare e analizzare dati in tempo reale. Un elemento chiave della crescita e del successo dell’azienda è la sua capacità di fornire benefici derivanti dai dati in streaming a organizzazioni di vari settori verticali. In particolare, Redpanda sta ottenendo un ampio utilizzo da parte di fornitori di intelligenza artificiale (AI) e machine learning (ML), tra cui il servizio di generazione di immagini AI generative Midjourney.
Redpanda è compatibile con Apache Kafka, una popolare tecnologia di streaming open source. L’azienda sostiene di offrire migliori prestazioni e una gestione più semplice per i casi d’uso in tempo reale rispetto alle alternative presenti sul mercato.
“Abbiamo quintuplicato le entrate dello scorso anno e abbiamo iniziato a vincere ogni affare”, ha dichiarato Alex Gallego, fondatore e CEO di Redpanda. “Il nostro obiettivo è alimentare la crescita, continuando ad investire in quello che consideriamo il futuro dello streaming”.
Un caso d’uso fondamentale per Redpanda è l’abilitazione di pipeline di dati AI/ML in tempo reale. Gallego ha affermato che esiste un modello comune tra le diverse società di AI/ML con cui Redpanda collabora. Quando un utente interagisce con un servizio di intelligenza artificiale generativa come Midjourney, inserisce un prompt di testo. Il prompt accede a un’API del servizio specifico, che genera quindi un risultato. Durante questo processo, tutte le richieste dell’utente vengono registrate in un sistema di archiviazione dati. Questo sistema sta diventando sempre più un sistema di streaming in tempo reale come Redpanda.
I prompt trasmessi in streaming vengono utilizzati per consentire l’inferenza in tempo reale e per aiutare nella successiva formazione.
“Redpanda è stato utilizzato in diversi casi d’uso AI/ML perché è un motore di archiviazione altamente scalabile per l’apprendimento automatico in tempo reale”, ha affermato Gallego. “È qui che Redpanda si distingue, poiché ci sono pochi motori di archiviazione in grado di gestire i volumi di dati richiesti da questi modelli in tempo reale”.
Guardando al futuro, Redpanda sta lavorando per fornire funzionalità estese, come il supporto per Apache Iceberg.
Iceberg è un formato di tabella di data lake open source che ha guadagnato popolarità negli ultimi anni e ha ottenuto il supporto di fornitori come Cloudera, Snowflake e Google.
Gallego ha spiegato che gli utenti si connettono a Redpanda attraverso un’API di Kafka, perché è così che le persone consumano e producono dati. Redpanda ha sviluppato un formato di archiviazione a più livelli che consente agli utenti di conservare i dati localmente e caricarli in un data lake. Attualmente, Redpanda sta lavorando per abilitare il supporto Iceberg, in modo che i dati caricati nel data lake vengano formattati per essere facilmente accessibili tramite motori di query SQL.
“In pratica, stiamo creando un data lake in tempo reale e il formato che utilizziamo per caricare i dati nel data lake è Apache Iceberg, in modo che un utente possa passare da un flusso a una query SQL in pochi secondi”, ha spiegato Gallego.