FACEBOOK HA SVELATO IL SUO SISTEMA DI INTELLIGENZA ARTIFICIALE DIETRO LE NUOVE ESPERIENZE DI ACQUISTO
Recentemente, i ricercatori di Facebook AI hanno annunciato di aver costruito e implementato un sistema universale di Computer Vision progettato per lo shopping noto come GrokNet . Il colosso dei social media ha svelato gli approcci per la costruzione di un accurato sistema di riconoscimento dei prodotti di immagine, GrokNet. È un modello unificato di visione artificiale che incorpora un insieme diversificato di 83 funzioni di perdita, ottimizzando congiuntamente per un accurato riconoscimento del prodotto e varie attività di classificazione su 7 set di dati commerciali.
Si dice che i sistemi di acquisto basati sull’intelligenza artificiale sfruttino modelli di riconoscimento delle immagini all’avanguardia per migliorare il modo in cui le persone acquistano, vendono e scoprono oggetti. In un post sul blog, i ricercatori hanno affermato : “La nostra visione a lungo termine è quella di costruire e sviluppare un assistente di stile di vita AI in tempo reale all-in-one in grado di cercare e classificare miliardi di prodotti con precisione, personalizzando secondo i gusti delle persone. Lo stesso sistema renderebbe lo shopping online tanto social quanto lo shopping con gli amici nella vita reale. ”
Hanno aggiunto : “Facendo un passo avanti, avanzerebbe la ricerca visiva per rendere shoppable l’ambiente del mondo reale. Se vedi qualcosa che ti piace (abbigliamento, mobili, elettronica, ecc.), Potresti scattare una foto e il sistema troverebbe quell’articolo esatto, così come molti altri simili per acquistare immediatamente il prodotto. “
Perché questo nuovo sistema?
Lo shopping è uno dei compiti più impegnativi che i sistemi di intelligenza artificiale devono affrontare perché il gusto personale delle persone è soggettivo. Al fine di costruire un assistente veramente intelligente, i ricercatori devono insegnare ai sistemi a comprendere i gusti e lo stile di ogni individuo, incluso il contesto che importa quando si cerca un prodotto per adattarsi a un’esigenza o una situazione specifica.
Facebook Marketplace svolge un ruolo importante per molte persone in tutto il mondo per fornire una piattaforma per la vendita e l’acquisto di prodotti da membri e aziende di Facebook . Attualmente, il gigante dei social media utilizza classificatori di immagini per aumentare le descrizioni dei prodotti con attributi, categorie e query di ricerca previsti, migliorando così la capacità di trovare e sfogliare i prodotti. Il sistema di riconoscimento delle immagini ha utilizzato i dati di interazione del registro di ricerca per addestrare questi classificatori di immagini con dati su larga scala con supervisione debole.
Secondo i ricercatori, lo sviluppo del nuovo sistema ha reso Facebook AI un passo avanti rispetto alla visione di ottenere un robusto assistente di stile di vita AI. GrokNet è un sistema di riconoscimento delle immagini distribuito per applicazioni commerciali che sfrutta un approccio di apprendimento multi-task per addestrare un singolo trunk di visione computerizzata . Si dice che questo nuovo sistema di intelligenza artificiale raggiunga un miglioramento di 2,1 volte nella precisione esatta della corrispondenza del prodotto rispetto al precedente sistema di riconoscimento del prodotto Facebook all’avanguardia.
Dietro GrokNet
GrokNet è un modello unificato di visione artificiale che incorpora un modello sottostante di rete neurale convoluzionale (CNN) che costituisce il “tronco” del modello. Il sistema è costruito come flusso di lavoro PyTorch distribuito sul framework FBLearner. Il modello di trunk per GrokNet utilizza ResNeXt-101 32 × 4d. Dopo l’inizializzazione dei pesi, il sistema viene messo a punto sui set di dati utilizzando l’addestramento GPU parallelo dati distribuito su host da 8 GPU, su 12 host (96 GPU totali).
Il modello è addestrato su annotazioni umane, tag generati dall’utente e dati di interazione dei motori di ricerca rumorosi. Secondo i ricercatori, il sistema addestrato finale analizza le immagini per prevedere la categoria di oggetti, gli attributi domestici, gli attributi di moda, gli attributi del veicolo, le query di ricerca e l’incorporamento delle immagini.
Per questo modello, i ricercatori hanno combinato 7 set di dati diversi con semantica di etichette di ampia portata e statistiche di immagini, in cui il set di dati combinato contiene 89 milioni di immagini pubbliche da Facebook Marketplace e diverse statistiche di immagini includono foto degli utenti dei prodotti del Marketplace in vendita. Il modello è addestrato sia su annotazioni fornite dall’uomo che su segnali deboli.
Riassumendo
Secondo i ricercatori, uno degli obiettivi di questo progetto era risolvere un gran numero di compiti di visione artificiale con un unico modello, formando sia su set di dati esistenti che su molti nuovi.
I ricercatori hanno già utilizzato questo sistema per lanciare automaticamente i dettagli delle inserzioni popolate nelle inserzioni dei venditori del Marketplace. Secondo loro, GrokNet svolgerà un ruolo importante nel rendere virtualmente qualsiasi foto acquistabile attraverso le app su Facebook e potrebbe essere utilizzata per aiutare i clienti a trovare quello che stanno cercando, ricevere suggerimenti personalizzati e molto altro.