Gretel.ai, una piattaforma per la generazione di dati sintetici e di tutela della privacy, raccoglie 50 milioni di dollari 

Gretel.ai , una piattaforma per la generazione di dati sintetici e di tutela della privacy, ha annunciato oggi di aver raccolto 50 milioni di dollari in una serie B guidata da Anthos Capital con la partecipazione di Section 32, Greylock e Moonshots Capital. I fondi portano il totale della società raccolto a $ 65,5 milioni e saranno utilizzati per supportare lo sviluppo del prodotto, secondo il CEO Ali Golshan, con un’attenzione particolare all’espansione in nuovi casi d’uso.

I dati sintetici, che vengono utilizzati per sviluppare e testare i sistemi software in tandem con i dati del mondo reale, sono diventati di moda man mano che le aziende abbracciano sempre più la digitalizzazione durante la pandemia. In un recente sondaggio tra i dirigenti, l’89% degli intervistati ha affermato che i dati sintetici saranno essenziali per rimanere competitivi. E secondo Gartner, entro il 2030, i dati sintetici metteranno in ombra i dati reali nei modelli di intelligenza artificiale.

 
Gretel fornisce una piattaforma che consente agli sviluppatori di sperimentare, collaborare e condividere dati con altri team, divisioni e organizzazioni. I clienti possono sintetizzare, trasformare e classificare i dati utilizzando una combinazione di strumenti e API, che applicano tecniche di intelligenza artificiale per generare sostituti sintetici per i dati di produzione.

“Gli strumenti di Gretel consentono agli sviluppatori e ai professionisti dei dati di rimuovere i colli di bottiglia significativi e abilitare la ‘privacy by design'”, ha detto Golshan a VentureBeat via e-mail. “[Con esso, i clienti possono] sintetizzare i dati per potenziare set di dati sottorappresentati per l’addestramento di machine learning e modelli di intelligenza artificiale, sintetizzare dati per addestrare modelli di machine learning e di intelligenza artificiale in cui i dati sintetizzati prodotti non contengono dati sensibili o di identificazione personale, [e] trasformare i dati per alimentare gli ambienti di preproduzione e i test con dati anonimi”.

 
Gretel, con sede a San Diego, è stata fondata nel 2020 da Golshan, Alexander Watson, John Myers e Laszlo Bock. Bock è stato l’ex vicepresidente senior di Google, mentre Watson ha guidato la startup di sicurezza Harvest.ai fino a quando non è stata acquisita da Amazon per circa 20 milioni di dollari nel 2017.

Dati a tutela della privacy
Secondo Golshan, la pandemia ha accelerato la tendenza verso una regolamentazione e conformità più rigorose sulla privacy dei dati e, di conseguenza, la richiesta di strumenti per la privacy per mitigare questi e altri rischi relativi alla privacy degli utenti.

Secondo un sondaggio Privitar , il 51% dei consumatori intervistati non si sente a proprio agio nel condividere le proprie informazioni personali . E in un rapporto Veritas, il 53% degli intervistati afferma che spenderebbe di più con organizzazioni affidabili, con il 22% che afferma che spenderebbe fino al 25% in più con un’azienda che prende sul serio la protezione dei dati.

L’attuale contesto economico sta anche spingendo le aziende a muoversi più velocemente per rimanere competitive, il che crea anche dei rischi. In generale, gli esperti di sicurezza citano il ritmo di adozione della tecnologia come uno dei principali fattori che contribuiscono all’attuale ambiente del crimine informatico. E la ricerca pubblicata da KPMG  suggerisce che un gran numero di organizzazioni ha aumentato i propri investimenti nell’IA durante la pandemia al punto che i dirigenti sono ora preoccupati di muoversi troppo velocemente.

 

Mentre i dati sintetici rispecchiano da vicino i dati del mondo reale, matematicamente o statisticamente, la giuria è fuori dalla sua efficacia. Un documento pubblicato dai ricercatori della Carnegie Mellon delinea le sfide con la simulazione che impediscono lo sviluppo del mondo reale, compresi i problemi di riproducibilità e il cosiddetto “gap di realtà”, in cui gli ambienti simulati non rappresentano adeguatamente la realtà.

 
Altre ricerche suggeriscono che i dati sintetici possono essere altrettanto utili per l’addestramento di un modello rispetto ai dati basati su eventi o persone reali. Ad esempio, i ricercatori di Nvidia hanno dimostrato un modo per utilizzare i dati creati in un ambiente virtuale per addestrare i robot a raccogliere oggetti come lattine di zuppa, una bottiglia di senape e una scatola di Cheez-Its nel mondo reale.

“Nello spazio della privacy, ci sono aziende tradizionali più focalizzate sulla conformità e sulle normative, e ci sono startup che si concentrano su dati sintetici per applicazioni di nicchia, ma Gretel ha adottato un approccio molto più scalabile mettendo a disposizione dati sintetici e strumenti per la privacy lungimiranti sviluppatori come API”, ha affermato Golshan. “I dati sintetici sono uno strumento nella suite di strumenti per la privacy che offriamo, che include la classificazione e la trasformazione utilizzando funzionalità avanzate di intelligenza artificiale”.

Un set di strumenti in crescita
Gretel afferma che la sua piattaforma è indipendente dalla tecnologia e dal verticale, compatibile con una vasta gamma di framework, app e linguaggi di programmazione. Copre attività come l’etichettatura dei dati tramite la suddetta API, nonché la generazione di report per punteggi e metriche di alto livello che aiutano a valutare la qualità dei dati sintetici di Gretel.

Allontanandosi da rivali tra cui Tonic, Delphix, Mostly AI e Hazy, Gretel afferma di lavorare con marchi di scienze della vita, finanziari, di gioco e tecnologici su applicazioni “trasformative”, come la creazione di cartelle cliniche sintetiche che possono essere condivise tra le organizzazioni sanitarie. Gretel è nella fase beta del suo rilascio e attualmente non sta caricando utenti o clienti, ma Golshan afferma di aver raggiunto la prova del concetto con diversi potenziali clienti e si aspetta che queste società passino a clienti paganti una volta che la piattaforma sarà disponibile all’inizio del prossimo anno.

“Abbiamo quasi 75.000 download della nostra distribuzione open source, la versione ‘open core’ di Gretel del suo sintetizzatore”, ha affermato Golshan. “Abbiamo 20 dipendenti a tempo pieno e ci stiamo espandendo rapidamente… Entro la fine dell’anno 2022, prevediamo di assumere da 50 a 75 dipendenti in più, che includeranno più ingegneri e ricercatori, esperti di marketing, product manager, sostenitori degli sviluppatori e vendite”.

 

Di ihal