Con l’importanza crescente dei dati nel successo aziendale, le aziende sono sempre più alla ricerca di modi per sfruttare al meglio le informazioni a loro disposizione. Tuttavia, il volume dei dati continua a crescere rapidamente, raddoppiando ogni due anni, e questo sta mettendo a dura prova le capacità di elaborazione esistenti.
DataPelago, una startup californiana, sta cercando di risolvere questo problema attraverso un “motore di elaborazione dati universale”. Questo motore consente alle aziende di migliorare le prestazioni dei loro sistemi di query esistenti, inclusi quelli open source, utilizzando tecnologie di elaborazione avanzate come GPU e FPGA (Field-Programmable Gate Arrays). Grazie a questa innovazione, le aziende possono gestire volumi crescenti di dati complessi in vari formati.
Nonostante sia una startup recente, DataPelago afferma di poter ridurre la latenza delle query di cinque volte, con costi notevolmente inferiori. Ha recentemente raccolto 47 milioni di dollari in finanziamenti da investitori come Eclipse, Taiwania Capital e Qualcomm Ventures.
Negli ultimi dieci anni, l’analisi dei dati strutturati e semi-strutturati era la norma per le aziende, fornendo una visione chiara del loro andamento. Tuttavia, l’aumento dei dati non strutturati, come immagini, file audio e video, ha cambiato il panorama, rappresentando oggi il 90% delle informazioni create. Le aziende che cercano di utilizzare questi dati per applicazioni avanzate, come i modelli di intelligenza artificiale, si trovano a fronteggiare colli di bottiglia nelle prestazioni e nelle tempistiche di elaborazione.
Rajan Goyal, CEO di DataPelago, spiega che le piattaforme legacy, progettate per dati strutturati, stanno mostrando i loro limiti. Le aziende hanno due opzioni per l’elaborazione dei dati: sistemi open source, che comportano costi di licenza inferiori ma costi elevati per l’infrastruttura cloud, o servizi proprietari, che offrono prestazioni migliori ma a costi molto più elevati.
DataPelago propone una piattaforma unificata che accelera i motori di query attraverso hardware di elaborazione avanzato, come GPU e FPGA. Questo consente di ridurre drasticamente il numero di server necessari, abbattendo così i costi di infrastruttura e di licenza. Secondo Goyal, i clienti possono ottenere un rapporto costo/prestazioni significativamente migliore, rendendo più accessibile l’analisi dei dati.
Il motore di DataPelago si basa su tre componenti principali: DataApp, DataVM e DataOS. DataApp consente l’integrazione con framework open source come Apache Spark, mentre DataOS e DataVM gestiscono il carico di lavoro e l’assegnazione delle risorse hardware in modo dinamico, ottimizzando le prestazioni.
DataPelago ha già dimostrato di poter ridurre la latenza delle query e il costo totale di proprietà (TCO) rispetto ai sistemi di elaborazione dati esistenti. Ad esempio, un’azienda con un carico di lavoro di 140 milioni di dollari è riuscita a ridurre i costi a meno di 50 milioni di dollari grazie alla soluzione di DataPelago.
La startup sta attirando l’attenzione di importanti aziende in vari settori, tra cui sicurezza, finanza e telecomunicazioni. Tra i suoi clienti ci sono nomi noti come Samsung SDS e McAfee.
André Fichel, CTO di Akad Seguros, ha dichiarato che il motore di DataPelago consente di unificare le pipeline di analisi dei dati, riducendo i costi di oltre il 50%.