La chiave per un’IA pronta per la produzione nel 2022
Lo studio Datagen suggerisce l’adozione diffusa di dati sintetici
Un nuovo studio commissionato da Datagen , leader nella generazione di dati sintetici , ha ottenuto molti risultati approfonditi su come i dati sintetici vengono utilizzati nel campo della visione artificiale (CV) per far progredire le applicazioni di intelligenza artificiale (AI) e machine learning (ML).
Il nuovo studio, condotto da Wakefield Research ed esplorato i dati di formazione nel campo della visione artificiale, era intitolato “Dati sintetici: chiave per la produzione – Ready AI in 2022”. Ha intervistato 300 professionisti CV provenienti da 300 organizzazioni uniche in diversi settori.
Coalescenza intorno ai dati sintetici
Una delle scoperte principali è stata che il campo sta iniziando a fondersi attorno ai dati sintetici, sfruttandoli per risolvere problemi che comportano ritardi e cancellazioni del progetto.
Un altro punto importante dello studio è stata l’enfasi sul fatto che i dati sulla formazione sono diventati una fonte di complicazioni per i professionisti della visione artificiale, il che porta a un rallentamento dei progressi dell’azienda nel CV.
I problemi che erano più prevalenti includevano: tempo e/o risorse sprecati per riqualificare il sistema; annotazione scadente con conseguente problemi di qualità; scarsa copertura dei dati del dominio dell’applicazione prevista; e mancanza di una quantità sufficiente di dati.
Problemi come questi ostacolano l’avanzamento di un progetto e hanno portato la maggior parte dei team di CV a subire ritardi significativi e cancellazioni di progetti. Secondo il sondaggio, il 99% degli intervistati ha subito cancellazioni di progetti, l’80% ha subito ritardi di progetto della durata di almeno 3 mesi e il 33% ha subito ritardi di progetto della durata di 7 mesi o più.
Interesse diffuso e adozione
Lo studio ha anche rilevato molte tendenze che indicano un interesse diffuso per i dati sintetici. Più specificamente, il 96% dei team di visione artificiale ha riferito di utilizzarlo già nella formazione e nel test dei modelli di visione artificiale.
Datagen ha anche chiesto alle organizzazioni quale fosse la loro motivazione principale dietro l’uso di dati sintetici e i team hanno riferito che stava testando, addestrando e affrontando casi limite.
Per quanto riguarda i vantaggi dei dati sintetici, gli intervistati hanno affermato che i più importanti sono stati la riduzione del tempo di produzione, l’eliminazione dei problemi di privacy, la riduzione dei pregiudizi, un minor numero di errori di annotazione ed etichettatura e miglioramenti nella modellazione predittiva.
Ofir Chakon è fondatore e CEO di Datagen.
“I dati sintetici sono il futuro dei dati. Questo è il nuovo modo per controllare e consumare i dati di cui i nostri sistemi di intelligenza artificiale hanno bisogno”, ha affermato Chakon. “Man mano che la simulazione migliora nel tempo, con tutti i suoi vantaggi, prenderà il posto della raccolta manuale dei dati che richiede molta manodopera e che non è più scalabile alla velocità con cui si evolve il mondo”.