Cord , una startup che automatizza i processi di annotazione per la visione artificiale, ha annunciato oggi di aver raccolto $ 4,5 milioni in un seed round guidato da CRV. Il CEO Eric Landau afferma che il capitale sarà destinato all’espansione della base di clienti e della piattaforma di Cord mentre l’azienda cerca di assumere dipendenti aggiuntivi.

La formazione di algoritmi di intelligenza artificiale e machine learning richiede molti dati annotati. Ma i dati raramente vengono forniti con annotazioni. La maggior parte del lavoro spesso spetta agli etichettatori umani, i cui sforzi tendono ad essere costosi, imperfetti e lenti. Si stima che la maggior parte delle aziende che adottano l’apprendimento automatico spenda oltre l’80% del proprio tempo nell’etichettatura e nella gestione dei dati. Infatti, in un recente sondaggio condotto dalla startup  CloudFlower , i data scientist hanno affermato di dedicare il 60% del tempo solo all’organizzazione e alla pulizia dei dati rispetto al 4% a perfezionare gli algoritmi.

 
“L’azienda è iniziata quando il mio cofondatore, Ulrik Stig Hansen, ha lasciato il lavoro alla JP Morgan per seguire un corso di laurea in informatica presso l’Imperial College di Londra”, ha detto Landau a VentureBeat via e-mail. “Il mio background era in fisica come dottorato di ricerca. abbandonato da Harvard, ma lavoravo nel commercio quantitativo dove mettevo in produzione migliaia di modelli. Ho incontrato Hansen in una rete imprenditoriale a Londra, e dopo qualche pinta al pub, ci siamo resi conto che la nostra prospettiva della finanza poteva essere applicata al processo di etichettatura dei dati”.

 

Cord offre una piattaforma di annotazione di visione artificiale che automatizza una serie di attività di etichettatura manuale. La sua suite di strumenti è progettata per la collaborazione tra ruoli e team, da annotatori esperti di dominio a project manager e ingegneri di machine learning.

Cord è stata fondata nel 2020 da Landau, un ex studente di fisica di Harvard, insieme a Leeho Lim e Ulrik Stig Hansen. Landau ha lasciato un lavoro nel settore fintech per avviare l’azienda, con l’obiettivo di applicare i principi della finanza quantitativa al processo di etichettatura dei dati.

Caratteristiche
Con l’app Web di Cord, gli utenti possono annotare, classificare e segmentare immagini e video, nonché eseguire revisioni del controllo qualità e addestrare modelli “all’avanguardia”. L’API di automazione della piattaforma consente agli sviluppatori di automatizzare il campionamento, l’aumento, la trasformazione, l’etichettatura e la valutazione dei dati con algoritmi di dati di addestramento personalizzati mentre l’SDK di Python addestra modelli, compone programmi di dati, raccoglie algoritmi di dati di addestramento e acquisisce ed elabora i dati.

Cord offre funzionalità di tracciamento dei punti chiave che aiutano ad accelerare il processo di annotazione per arrivare all’AI di produzione per la stima della posa umana. Strumenti complementari consentono agli sviluppatori di creare dati di addestramento per modellare il movimento e l’interazione umana, mentre gli algoritmi di tracciamento degli oggetti e di etichettatura dell’interpolazione sfruttano le caratteristiche temporali nei dati video. Un dashboard crea etichette per il rilevamento degli oggetti e la segmentazione delle immagini, generando ID di istanza univoci in singoli frame. E gli strumenti di etichettatura vettoriale consentono agli utenti di annotare dati rilevanti di immagini e video.

 

Cord può applicare classificazioni nidificate, impostare strutture di etichette con relazioni gerarchiche, assegnare attributi personalizzati e preservare relazioni condizionali a livello di singolo oggetto. Questo aiuta a tenere traccia dei conteggi di oggetti e classificazioni nei dati di addestramento oltre alla composizione di classi e attributi, secondo Landau.

 
Cord è in una categoria adiacente ad aziende come Scale AI, che ha raccolto centinaia di milioni per la sua suite di servizi di etichettatura dei dati, e CloudFactory , che afferma che offre opportunità di crescita agli etichettatori e bonus “guidati dalle metriche”. Per non parlare di Hive , Alegion ,  Appen ,  SuperAnnotate ,  Dataloop , Labelbox , Superb AI e Cognizant, che occupano tutti un mercato globale degli strumenti di annotazione dei dati valutato oltre $ 494 milioni nel 2020, secondo Grand View Research.

Ma Cord è riuscito a catturare una dozzina di clienti tra cui il King’s College di Londra, un fornitore “leader” di automazione per ristoranti e una società di intelligenza artificiale del comportamento umano.

Uno dei clienti di Cord, la Divisione di Nefrologia della Stanford University, afferma di aver ridotto la durata dell’esperimento dell’80% durante l’elaborazione di 3 volte più immagini. Prima di distribuire Cord, Stanford utilizzava tre diversi software per identificare, annotare e contare i podociti (cellule renali) e i glomeruli (gruppi di terminazioni nervose) nelle immagini al microscopio. Dopo che il gruppo di nefrologia ha iniziato a utilizzare la piattaforma di dati di addestramento di Cord e l’SDK per automatizzare le segmentazioni, contare e calcolare le dimensioni dei segmenti, è riuscito a ridurre la durata dell’esperimento da una media di 21 a 4 giorni.

“Qualsiasi azienda che sta cercando di costruire un modello di intelligenza artificiale ha bisogno di molti dati di formazione etichettati per farlo. Questo processo è spesso dispendioso in termini di tempo e denaro poiché è altamente manuale con gli strumenti esistenti. Utilizzando la nostra [piattaforma], le aziende sono in grado di generare dati di formazione in modo molto più rapido ed economico, senza dover spedire i dati altrove”, ha affermato Landau.

Cord, che ha sede a Londra, ha raccolto $ 125.000 in un aumento pre-seed prima di questo ultimo round di finanziamento. Y Combinator, Crane Venture Partners e la Harvard Management Company hanno partecipato a questo ultimo round.

Di ihal