Oggi, Parallel Domain, una piattaforma di dati sintetici, ha annunciato il lancio di Reactor, un motore all’avanguardia per la generazione di dati sintetici. Reactor integra tecnologie avanzate di intelligenza artificiale generativa con capacità proprietarie di simulazione 3D. L’obiettivo principale di questa piattaforma è fornire agli sviluppatori di machine learning (ML) un controllo e una scalabilità migliori, consentendo loro di generare dati completamente annotati che migliorano le prestazioni dell’IA. Ciò promuove la creazione di sistemi di intelligenza artificiale più sicuri e resilienti per le applicazioni del mondo reale.
Secondo Parallel Domain, Reactor migliora le prestazioni dell’IA in vari settori, come veicoli autonomi e droni, generando immagini di alta qualità. Inoltre, questo strumento sfrutta la potenza dell’IA generativa per produrre dati annotati, che è un requisito fondamentale per le attività di ML.
Reactor genera sia riquadri di delimitazione (per il rilevamento degli oggetti) che annotazioni di segmentazione panottica (che forniscono viste complete/panoramiche), garantendo che i modelli AI possano utilizzare efficacemente i dati visivi, ottenendo risultati più accurati e affidabili.
Kevin McNamara, CEO e fondatore di Parallel Domain, ha dichiarato a VentureBeat: “La nostra tecnologia proprietaria di intelligenza artificiale generativa consente agli utenti di creare e manipolare dati sintetici utilizzando prompt intuitivi del linguaggio naturale, generando anche le etichette corrispondenti necessarie per l’addestramento e il test dei modelli ML. Reactor ha portato a significativi miglioramenti delle prestazioni in attività come la segmentazione dei pedoni e il rilevamento di detriti e passeggini. La sua capacità di migliorare la diversità dei set di dati, in particolare per le classi rare, contribuisce alla formazione superiore dei modelli”.
La piattaforma di Parallel Domain consente agli utenti di creare una vasta gamma di dati sintetici per addestrare e testare i modelli di percezione. Questo viene realizzato integrando Python e il linguaggio naturale, eliminando la necessità di creare risorse personalizzate che richiedono tempo e semplificando il flusso di lavoro per migliorare l’efficienza. Di conseguenza, gli sviluppatori di ML possono iterare e perfezionare rapidamente i loro modelli, riducendo i tempi di consegna e accelerando il progresso dello sviluppo dell’IA.
“L’integrazione di queste tecnologie nella nostra piattaforma consente agli utenti di generare dati utilizzando Python e comandi in linguaggio naturale, migliorando la flessibilità della generazione di dati sintetici”, ha spiegato McNamara a VentureBeat. “Reactor fornisce agli sviluppatori ML controllo e scalabilità, ridefinendo il panorama della generazione di dati sintetici. Con Reactor, gli utenti possono generare quasi tutti gli asset in pochi secondi utilizzando prompt in linguaggio naturale”.
A differenza di altre aziende che utilizzano l’IA generativa per creare dati visivamente accattivanti ma inutilizzabili per l’addestramento dei modelli ML senza annotazioni, Reactor supera questa limitazione generando dati completamente annotati. Ciò migliora il processo di ML e consente agli sviluppatori di creare sistemi di intelligenza artificiale più sicuri ed efficaci.
Parallel Domain sfrutta l’intelligenza artificiale generativa e la simulazione 3D per creare dati sintetici dettagliati e realistici. L’IA generativa consente la produzione di diversi scenari e oggetti, mentre la simulazione 3D aggiunge realismo fisico, garantendo la robustezza dei modelli di intelligenza artificiale addestrati su questi dati. Reactor supera le difficoltà dei modelli generativi nel fornire annotazioni come i bounding box e la segmentazione panottica, che sono cruciali per l’addestramento e il test dei modelli di intelligenza artificiale.
Secondo McNamara, Reactor offre un’ampia gamma di opzioni di personalizzazione dei dati e delle scene. La funzione di creazione dello sfondo adattivo consente una facile modifica delle scene generate, consentendo ai modelli ML di essere generalizzati in vari ambienti. Ad esempio, gli utenti possono trasformare un’ambientazione suburbana della California in una vivace scena del centro di Tokyo.
I suggerimenti in linguaggio naturale di Reactor introducono un modo intuitivo per generare variazioni di immagine. Gli utenti possono modificare le immagini esistenti utilizzando semplici suggerimenti come “fai sembrare questa immagine una tempesta di neve” o “metti gocce di pioggia sull’obiettivo”. Questo processo semplificato di personalizzazione elimina la necessità di attendere la creazione di risorse personalizzate, migliorando l’efficienza e i tempi di consegna.
Parallel Domain ha evidenziato che l’architettura generativa di Reactor consente ai modelli di comprendere la struttura degli oggetti generati e delle scene sottostanti. Ciò facilita l’estrazione di pixel e la comprensione semantica spaziale, generando annotazioni completamente automatiche e accurate.
Utilizzando Python, gli utenti possono configurare in modo flessibile i propri set di dati sintetici, selezionando vari parametri come località (San Francisco, Tokyo), ambienti (urbani, suburbani, autostradali), condizioni meteorologiche e distribuzione degli agenti (pedoni e veicoli).
Una volta configurato il set di dati di base, gli utenti possono utilizzare Reactor per migliorare i propri dati sintetici, aggiungendo maggiore diversità e realismo. Utilizzando suggerimenti in linguaggio naturale, gli utenti possono introdurre nella scena un’ampia gamma di oggetti e scenari, come “bidone della spazzatura”, “scatola di cartone piena di occhiali da sole rovesciati a terra”, “cassa di legno di arance” o “passeggino”.
Reactor genera dati sintetici con annotazioni essenziali, inclusi riquadri di delimitazione e segmentazione panottica, accelerando notevolmente l’addestramento e il test dei modelli ML.
Parallel Domain ha riferito di notevoli miglioramenti nella sicurezza dei veicoli autonomi e dei sistemi avanzati di assistenza alla guida automobilistica (ADAS). Grazie a tecniche di diffusione avanzate, Reactor ha recentemente ottenuto risultati notevoli in scenari del mondo reale.
Inoltre, la piattaforma ha migliorato significativamente i risultati della segmentazione semantica sul Cityscapes Dataset, un punto di riferimento ampiamente riconosciuto per la guida autonoma.
Parallel Domain ha affermato che Reactor ha colmato una lacuna nei dati del mondo reale, generando dati sintetici raffiguranti oggetti meno comuni ma di fondamentale importanza, come i passeggini. Introducendo questi dati sintetici nei set di addestramento, i modelli possono apprendere e generalizzare meglio il rilevamento dei passeggini in scenari del mondo reale, migliorando la sicurezza dei sistemi autonomi.
La società ha anche sottolineato che molti dei suoi clienti hanno iniziato a incorporare la capacità di Reactor nei loro flussi di lavoro di sviluppo di intelligenza artificiale. Sebbene sia ancora nelle fasi iniziali, Parallel Domain è entusiasta del potenziale di Reactor nel migliorare i modelli ML.
“Sia i clienti che il team di Parallel Domain ML hanno addestrato modelli che hanno superato significativamente le prestazioni di riferimento precedenti”, ha affermato McNamara. “La varietà di esempi generati da Reactor aumenta in modo significativo la diversità di un set di dati. Dati diversi addestrano grandi modelli e stiamo ridefinendo il panorama della generazione di dati sintetici”.