In che modo Hasty utilizza l’automazione e il feedback rapido per addestrare i modelli AI e migliorare l’annotazione
Quando si tratta delle aspettative dei clienti, la pandemia ha cambiato tutto
Scopri come accelerare il servizio clienti, ottimizzare i costi e migliorare il self-service in un mondo incentrato sul digitale.
La Computer vision sta giocando un ruolo sempre più centrale in tutti i settori industriali , da seguire i progressi nei cantieri edili per la distribuzione di scansione del codice a barre intelligente nei magazzini . Ma addestrare il modello di intelligenza artificiale sottostante per identificare con precisione le immagini può essere uno sforzo lento e ad alta intensità di risorse che non è garantito per produrre risultati. La neonata startup tedesca Hasty vuole aiutare con la promessa di strumenti di “prossima generazione” che accelerano l’intero processo di addestramento del modello per l’annotazione delle immagini.
Hasty, fondata a Berlino nel 2019, ha annunciato oggi di aver raccolto 3,7 milioni di dollari in un round seed guidato da Shasta Ventures . La società di VC della Silicon Valley ha una serie di uscite degne di nota al suo nome, tra cui Nest ( acquisita da Google), Eero ( acquisita da Amazon) e Zuora ( IPO ). Altri partecipanti al round includono iRobot Ventures e Coparion .
Il mercato globale della visione artificiale è stato fissato a $ 11,4 miliardi nel 2020, una cifra che si prevede salirà a oltre $ 19 miliardi entro il 2027. La preparazione e l’elaborazione dei dati è una delle attività più dispendiose in termini di tempo nell’intelligenza artificiale, rappresentando circa l’80% del tempo dedicato a progetti correlati. Nella visione artificiale, l’annotazione o l’etichettatura è una tecnica utilizzata per contrassegnare e classificare le immagini per dare alle macchine il significato e il contesto dietro l’immagine, consentendo loro di individuare oggetti simili. Gran parte di questo lavoro di annotazione ricade su fidati vecchi umani.
Il problema che Hasty sta cercando di risolvere è che la stragrande maggioranza dei progetti di data science non arriva mai in produzione , con risorse significative sprecate nel processo.
“Gli attuali approcci all’etichettatura dei dati sono troppo lenti”, ha detto a VentureBeat il cofondatore e CEO di Hasty Tristan Rouillard. “Gli ingegneri del machine learning spesso devono attendere da tre a sei mesi per i primi risultati per vedere se la loro strategia e il loro approccio di annotazione funzionano a causa del ritardo tra l’etichettatura e l’addestramento del modello”.
Fare in fretta
Hasty viene fornito con 10 assistenti AI automatizzati integrati, ciascuno dedicato a ridurre il lavoro umano. Dextr, ad esempio, consente agli utenti di fare clic su solo quattro punti estremi su un oggetto per evidenziarlo e suggerire annotazioni.
E l’assistente di “segmentazione delle istanze” di Hasty crea annotazioni più rapide quando trova più istanze di un oggetto all’interno di un’immagine.
Sopra: rapida segmentazione dell’istanza AI
L’assistente osserva mentre gli utenti annotano e può dare suggerimenti per le etichette una volta raggiunto un punteggio di affidabilità specifico. E l’utente può correggere questi suggerimenti per migliorare il modello mentre riceve feedback sull’efficacia della strategia di annotazione.
“Questo dà alla rete neurale una curva di apprendimento – impara sul progetto mentre etichetti”, ha detto Rouillard.
Ci sono già innumerevoli strumenti progettati per semplificare questo processo, tra cui SageMaker di Amazon , Google-backed Labelbox , V7 , e Dataloop , che ha annunciato un pesce vivo $ 11 milioni finanziare solo il mese scorso.
Ma Hasty afferma di poter rendere l’intero processo molto più veloce con la sua combinazione di automazione, addestramento del modello e annotazione.
Come con piattaforme simili, Hasty utilizza un’interfaccia attraverso la quale gli esseri umani e le macchine collaborano. Hasty può creare annotazioni suggerite dopo essere stato esposto a poche immagini annotate da persone, con l’utente (ad esempio l’ingegnere di apprendimento automatico) che accetta, rifiuta o modifica quel suggerimento. Questo feedback in tempo reale significa che i modelli migliorano quanto più vengono utilizzati in quello che viene spesso definito “volano dei dati”.
“Tutti stanno cercando di costruire un volano di dati auto-migliorante. Il problema con la visione (computerizzata) AI sta nel far girare il volano in primo luogo, [poiché] è super costoso e funziona solo il 50% delle volte: è qui che entriamo in gioco “, ha detto Rouillard.
Feedback rapido
In effetti, le reti neurali di Hasty apprendono mentre gli ingegneri costruiscono i loro set di dati, quindi le sfaccettature di “costruzione”, “distribuzione” e “valutazione” del processo avvengono più o meno contemporaneamente. Un tipico approccio lineare può richiedere mesi per arrivare a un modello AI testabile, che potrebbe essere profondamente difettoso a causa di errori nei dati o di ipotesi cieche fatte all’inizio del progetto. Ciò che Hasty promette è l’agilità.
Non è del tutto nuovo, ma Rouillard ha affermato che la sua azienda considera l’etichettatura automatizzata simile alla guida autonoma, in quanto diverse tecnologie operano a livelli diversi . Nella sfera dei veicoli a guida autonoma, alcune auto possono solo frenare o cambiare corsia, mentre altre sono in grado di raggiungere quasi la piena autonomia . Tradotto in annotazione, Rouillard ha affermato che Hasty porta l’automazione oltre molti dei suoi concorrenti, in termini di riduzione al minimo del numero di clic necessari per etichettare un’immagine o gruppi di immagini.
“Tutti predicano l’automazione, ma non è ovvio cosa viene automatizzato”, ha spiegato Rouillard. “Quasi tutti gli strumenti hanno buone implementazioni dell’automazione di livello 1, ma solo pochi di noi si prendono la briga di fornire i livelli 2 e 3 in modo da produrre risultati significativi”.
Poiché i dati sono essenzialmente il carburante per l’apprendimento automatico, ottenere più dati (accurati) in un modello di intelligenza artificiale su larga scala è fondamentale.
Oltre a uno strumento di ricerca manuale degli errori, Hasty offre un rilevatore di errori alimentato da AI che identifica automaticamente i probabili problemi nei dati di addestramento di un progetto. È una funzione di controllo della qualità che elude la necessità di cercare errori nei dati.
“Questo ti consente di dedicare il tuo tempo alla correzione degli errori invece di cercarli e ti aiuta a creare rapidamente fiducia nei tuoi dati mentre annoti”, ha detto Rouillard.
Hasty sostiene circa 4.000 utenti, un mix abbastanza uniforme di aziende, università, startup e sviluppatori di app che abbracciano quasi tutti i settori. “Abbiamo tre delle prime 10 società tedesche di logistica, agricoltura e vendita al dettaglio che utilizzano Hasty”, ha aggiunto Rouillard.
Un tipico caso d’uso agricolo potrebbe comportare la formazione di un modello di intelligenza artificiale per identificare colture, parassiti o malattie. Nella logistica, il modello può essere utilizzato per addestrare le macchine a smistare automaticamente i pacchi per tipo. Rouillard ha aggiunto che Hasty viene utilizzato anche nel regno dello sport per fornire analisi e statistiche di gioco in tempo reale per la copertura del calcio.
Con 3,7 milioni di dollari in banca, la società intende accelerare lo sviluppo del prodotto ed espandere la propria base di clienti in Europa e Nord America.