In collaborazione con ricercatori accademici in Cina, Alibaba ha sviluppato un motore di ricerca AI di simulazione che utilizza i dati del mondo reale dall’infrastruttura live del gigante dell’e-commerce al fine di sviluppare nuovi modelli di classificazione che non siano ostacolati da informazioni “storiche” o non aggiornate.

Il motore, chiamato AESim , rappresenta il secondo annuncio importante in una settimana per riconoscere la necessità per i sistemi di intelligenza artificiale di essere in grado di valutare e incorporare dati in tempo reale e attuali, invece di astrarre semplicemente i dati disponibili al momento dell’addestramento del modello. L’annuncio precedente è stato di Facebook, che la scorsa settimana ha presentato il modello linguistico BlenderBot 2.0, un’interfaccia NLP che offre polling live dei risultati di ricerca su Internet in risposta alle query.

L’obiettivo del progetto AESim è fornire un ambiente sperimentale per lo sviluppo di nuove soluzioni, algoritmi e modelli di Learning-To-Rank ( LTR ) nei sistemi di recupero delle informazioni commerciali. Nel testare il framework, i ricercatori hanno scoperto che rifletteva accuratamente le prestazioni online entro parametri utili e utilizzabili.

Gli autori dell’articolo, tra cui quattro rappresentanti ciascuno dell’università di Nanchino e della divisione di ricerca di Alibaba, affermano che un nuovo approccio alle simulazioni LTR era necessario per due ragioni: il fallimento di recenti iniziative simili nel deep learning per creare tecniche riproducibili, con un’ondata di attenzione -acquisizione di algoritmi che non si traducono in sistemi del mondo reale applicabili; e la mancanza di trasferibilità, in termini di prestazioni dei dati di formazione rispetto a dati nuovi nei casi in cui i sistemi erano inizialmente più efficaci.

In diretta
Il documento afferma che AESim è la prima piattaforma di simulazione di e-commerce basata sui dati degli utenti e delle attività attuali e attuali e che può riflettere accuratamente le prestazioni online mediante l’uso unilaterale di dati in tempo reale, fornendo un campo di addestramento del cielo blu per i ricercatori successivi per valutare metodologie e innovazioni LTR.

Il modello incorpora una nuova interpretazione di uno schema tipico per i motori di ricerca industriali: la prima fase è il recupero degli elementi relativi alla query dell’utente, che non vengono inizialmente presentati all’utente, ma vengono prima ordinati in base a un modello LTR ponderato. Quindi i risultati ordinati vengono passati attraverso un filtro che considera gli obiettivi dell’azienda nel fornire i risultati, obiettivi che possono includere pubblicità e fattori di diversità.

Architettura di AESim
In AESim, le query vengono sostituite con indici di categoria, consentendo al sistema di recuperare elementi da un indice di categoria prima di passarli a un re-ranker personalizzabile che produce l’elenco finale. Sebbene il framework consenta ai ricercatori di studiare gli effetti della classificazione congiunta su più modelli, questo aspetto viene lasciato per il lavoro futuro e l’implementazione attuale cerca automaticamente la valutazione ideale basata su un singolo modello.

L’architettura di AESim. Fonte: https://arxiv.org/pdf/2107.07693.pdf
AESim crea embedding (rappresentazioni virtuali nell’architettura di apprendimento automatico ) che incapsulano l'”utente virtuale” e la sua query e utilizza un approccio Wasserstein Generative Adversarial Network con Gradient Penalty ( WGAN-GP ).

L’architettura comprende un database di milioni di elementi disponibili ordinati per categoria, un sistema di classificazione personalizzabile, un modulo di feedback e set di dati sintetici generati dai componenti basati su GAN. Il modulo di feedback è la fase finale del flusso di lavoro, in grado di valutare le prestazioni dell’ultima iterazione di un modello di classificazione.

Apprendimento generativo per imitazione del contraddittorio
Al fine di modellare la logica decisionale del “Virtual User Module”, il modulo di feedback (che fornisce i risultati finali) viene addestrato tramite Generative Adversarial Imitation Learning ( GAIL ), una teoria proposta per la prima volta dai ricercatori di Stanford nel 2016. GAIL è un modello paradigma libero che consente a un sistema di sviluppare una politica direttamente dai dati attraverso l’ apprendimento per imitazione .

I set di addestramento sviluppati da AESim sono essenzialmente gli stessi dei set di dati storici statici utilizzati nei precedenti modelli di apprendimento supervisionato per sistemi simili. La differenza con AESim è che non si basa su un set di dati statico per il feedback e non è ostacolato dagli ordini di articoli generati al momento della compilazione dei (vecchi) dati di addestramento.

L’aspetto generativo di AESim è incentrato sulla creazione di un utente virtuale tramite WGAN-GP, che emette caratteristiche di utente e query “false” e quindi tenta di discernere questi dati falsi dai dati utente autentici forniti dalle reti live a cui AESim ha accesso .

 
I ricercatori hanno testato AESim implementando un’istanza pair-wise, point-wise e ListMLE nel sistema, ognuna delle quali doveva servire una porzione casuale di query di ricerca non intersecante nel contesto di un algoritmo di re-ranker.

A questo punto AESim è sfidato dai dati in tempo reale in rapida evoluzione e diversificati più o meno allo stesso modo in cui è probabile che lo sia il nuovo modello linguistico di Facebook. Pertanto i risultati sono stati considerati alla luce delle prestazioni complessive.

Testato per dieci giorni, AESim ha dimostrato una notevole coerenza su tre modelli, sebbene i ricercatori abbiano notato che un test aggiuntivo di un modulo Document Context Language Model ( DLCM ) ha funzionato male nell’ambiente offline, ma molto bene nell’ambiente live, e ammettono il sistema dimostrerà lacune con le sue controparti attive, a seconda della configurazione e dei modelli testati.

Di ihal