I database tradizionali non sono stati progettati con l’intelligenza artificiale in mente. Gestire dati complessi come vettori, immagini, video e audio su larga scala diventa problematico. Archiviare questi dati è una cosa, ma recuperarli in modo efficiente è un’altra sfida, soprattutto quando si tratta di dati multipli.
Mercoledì, una società sostenuta da Y Combinator ha annunciato di aver raccolto 11 milioni di dollari per sviluppare un database specificamente progettato per dati multimodali. Utilizza il formato colonnare Lance open source, ottimizzato per il machine learning. Il database integra nativamente lo storage di oggetti, garantendo prestazioni elevate e scalabilità per la gestione e il recupero dei dati AI.
LanceDB può essere utilizzato in tre modi: integrato nel backend esistente, eseguito direttamente da un’applicazione client come un Jupyter Notebook o distribuito come database serverless remoto. A differenza di altri database, LanceDB separa lo spazio di archiviazione dal calcolo e può essere incorporato direttamente nelle applicazioni.
Numerose organizzazioni, tra cui Midjourney, Character.ai, Airtable, Tubi, Hex e WeRide, già utilizzano questa piattaforma. Con il finanziamento ottenuto, LanceDB intende migliorare ulteriormente il suo prodotto per facilitare agli sviluppatori la transizione dei loro progetti AI dalla fase sperimentale a quella di produzione. Gli investitori includono CRV, Y Combinator, Essence VC e Swift Ventures.
Murat Bicer, partner di CRV, sottolinea l’importanza di infrastrutture dati e soluzioni di archiviazione all’avanguardia per supportare i modelli multimodali e le applicazioni di intelligenza artificiale future.
Le offerte commerciali di LanceDB includono un database open source completo con SDK per Rust, Python e JavaScript, una soluzione serverless ospitata e un prodotto aziendale rivolto a team con grandi set di dati e requisiti di sicurezza aziendale.